应该没人看这个频道吧
不是,微调了Qwen一下就这么强了?
这个点,周围响起了剧烈的鞭炮声
新年快乐了
DeepSeek发布新款开源多模态AI模型Janus-Pro

人工智能社区Hugging Face显示,DeepSeek刚刚发布了开源多模态人工智能(AI)模型Janus-Pro。

其中Janus-Pro-7B在GenEval和DPG-Bench基准测试中击败了OpenAI的DALL-E 3和Stable Diffusion。

Huggingface

📮投稿 ☘️频道 🌸聊天
DeepSeek状态更新,官方称“近期DeepSeek线上服务受到大规模恶意攻击”

DeepSeek Status

📮投稿 ☘️频道 🌸聊天
DeepSeek:谁打我,我刀谁😡
Google AI Studio里的Gemini和普通网页里的Gemini感觉完全不是一个东西啊

最近怎么老在玩AI
我的体感是目前国内大模型使用起来差别真不大,某些个模型Benchmark分数都是追得很紧,用起来能力上感觉差不多。
豆包方便在字节会做应用,浏览器插件、播客和视频总结啥的都是他们先搞出来的。所以我看来落地比能力更重要。
另外尝试了DeepSeek的R1,貌似和GPT o1、Gemini Thinking Model或者360 CoE类似。就是强化引导模型思考(这就是所谓的后训练?)
DeepSeek这次做得很好,并且开源出来是给国内模型给了一个新“抄路”。很快通义、豆包估计也要用强化学习之类去做模型了。到时候再看DeepSeek R1能力是否还能保持领先就是一个问题了。有可能还是大厂做得更好一些。我看“大模型六小龙”至少死4个。
最近DeepSeek风声是真大,我就比较好奇啊,到底是真本事还是舆论衬得它厉害了。
另外发现林亦做的这个大模型野榜竟然把DeepSeek给撤下去了,不知是什么原因。。。上星期看的时候还有DeepSeek的说,并且当时看榜的时候确实是DeepSeek屠榜,然而是v2.5模型屠的榜,而不是靠最近很火的“超越GPT4o”的MoE模型v3拿的榜首。当然了,我只是提到这一有趣的现象,这榜确实是野榜,并不能准确说明什么问题。
另外就是榜上的模型能力和我体感感受差距还是比较大的。理论上GLM、Gemini、Qwen很强,但我觉得这几个并不好用,目前还是GPT用的比较多。
当然如果有时间尝试一下别的模型也是好的。
芥川龙之介在日本文坛扮演着鲁迅的角色
和家人聊天,痛哭了一场。好久没哭得这么爽快了
知道了好多关于cf公司内外的故事!好棒的公司
躺在床上听播客,除此之外什么都不干
收获了久违的平静
最近的打算就是深入体验nixOS
Back to Top