同一套权重跑64遍,效果碾压参数翻倍的模型——循环Transformer正在颠覆AI推理 770M参数干翻1.3B模型,不是蒸馏不是剪枝,只是同一套权重循环跑了16次。OpenMythos用循环深度Transformer理论重建了Claude Mythos架构,MIT协议开源。
为什么 AI 剪视频不需要看视频——13.3k Star 的 video-use 藏着一个反直觉答案 一段 3 分钟的 1080p 视频,拆成帧大约 5400 张图。按 GPT-4o 的视觉 token 计价,光"看完"就要...