microGPT: Andrej Karpathy 发布的一个非常精简的 GPT 实现 | VibeCafé
VibeCafé
社群
工具
想法
阴明
@kalasoo
·
2026-03-01
microGPT: Andrej Karpathy 发布的一个非常精简的 GPT 实现
一个 用纯 Python (~200 行代码) 实现的 GPT 模型
不依赖任何深度学习库(没有 PyTorch / TensorFlow 等依赖)
包含 完整算法 — 数据集载入、分词(tokenizer)、模型架构、训练循环、优化器、inference(推理)等全部步骤
主要用于 教学、理解和实验,而不是用于生产级大模型训练。
karpathy.github.io
1
评论
分享
登录后评论
暂无评论