模型
京东开源模型登顶HuggingFace视频理解榜首,个人开发者模型亦冲入热榜
近日,京东开源模型JoyAI-VL-Interaction登顶HuggingFace视频理解类榜首,该模型主打“流式交互”,能主动判断何时说话或沉默,而非被动问答。技术报告显示,在与Gemini视频通话助手的人类评测中,整体胜率达87.9%,监控预警场景胜率100%。京东开源了8B模型、400万条对齐交互数据、训练配方及完整可部署系统,支持ASR/TTS、长程记忆、可视化界面和Agent桥接,可应用于比赛解说、监控预警、实时翻译等场景。
与此同时,个人开发者逯雨鑫(HuggingFace账号yuxinlu1)的模型也冲入热榜前排,下载量合计超70万。其发布的Gemma4-12B GGUF模型(V1 Coder版和V2 Agentic版)在编程和Agent任务上表现突出,V1曾连续多日霸榜。V1模型最小仅4.5GB,可在消费级显卡上本地运行;V2在tau2-bench telecom子集上得分55%,是基座模型的3.5倍。逯雨鑫表示,项目纯自费,耗时40多小时,使用RTX 5090训练,数据量仅约1万条,强调数据质量而非数量。他计划继续推出V3和基于Qwen3.6-27B的更大版本。
2026年6月28日来源:综合整理
相关资讯
Kimi K2.7 Code 发布:代码与Agent能力提升,Token消耗降低30%
6月15日 · 综合整理
豆包大模型2.1发布:Coding与Agent能力跨越生产级质变点
6月23日 · 综合整理
马斯克预测中国AI明年Q1达Fable水平,智谱唐杰回应:用不了那么久
6月19日 · 综合整理
智谱GLM-5.2发布并开源:Code Arena全球可用模型第一,1M上下文长程编程能力跃升
6月19日 · 综合整理
百度开源Unlimited OCR:单次推理解析数十页文档,刷新OmniDocBench SOTA
6月25日 · 综合整理
微博开源3B小模型VibeThinker,可验证推理性能比肩千亿参数大模型
6月19日 · 综合整理