信息资讯DeepSeek火出圈,英伟达完了吗?DeepSeekv3因为是后发,完全可以避开前人走的坑,用更高效方式避坑,也就是“站在巨人的肩膀上”。真实逻辑应该是:榨干同等算力去攫取10倍收益。就比如o1的训练成本远超GPT-赞 (0)xiaohuahua2024-12-29阅读(5)标签:模型训练 / 算力通缩