大规模假星存在:CMU 等机构 peer-reviewed 研究(ICSE 2026)通过 StarScout 工具分析 20TB GitHub 数据,发现 2019-2024 年约 600 万假星星,涉及 18,617 个仓库 和 30.1 万个账户。2024 年激增,到年中已有 16.66% 的 50+ 星仓库受影响,AI/LLM 项目是非恶意类别中受操纵最多的。
买卖公开透明:假星星在普通网站、Fiverr(有 24 个活跃 gig)、Telegram 频道公开出售,价格低至 $0.03–$0.90/个(甚至更低),有保量服务,无需暗网。部分服务如 SocialPlug 已交付超 310 万星星,还有中国 QQ/WeChat 群日处理 20 个仓库,年收入数百万美元。
检测特征明显:作者对 20 个仓库分析发现,假星仓库常有 36–76% 的 stargazer 零关注者、19–38% “鬼账户”(零仓库/零关注/零 bio),fork-to-star 比率远低于正常(如 0.017–0.052 vs. 有机仓库的 0.090–0.235)。GitHub 事后删除了 90%+ 被标记仓库和 57% 被标记账户,验证了检测准确性。
VC 融资驱动因素:风险投资机构把 GitHub 星星数当作重要信号(种子轮中位数 2,850 星,A 轮 4,980 星),许多 VC 写脚本自动抓取快速增长仓库,导致“刷星 → 上 Trending → 获关注 → 融资”的激励循环。刷 10k 星成本仅几百美元,却可能带来数百万融资。
影响与建议:假星星短期能推 Trending 和曝光,但长期成负担;扭曲开源发现、供应链安全(也波及 npm、VS Code 扩展等);GitHub 政策禁止但执行被动。建议采用加权指标(如网络中心性)、关注真实贡献者活跃度,或用 fork/star 比率等简单启发式筛查。研究强调:能刷星星,但刷不出真正修复 bug 的价值。

Inside GitHub's Fake Star Economy
Six million fake stars, $0.06 per click, and a VC funding pipeline that treats GitHub popularity as proof of traction. We ran our own analysis on 20 repos and found the fingerprints.
awesomeagents.ai
登录后评论