刷屏的DeepSeek,代码生成

刷屏的DeepSeek

+模型
 +训练 +算力
 +人工智能 +开源

12-29 17:20...来取得改进。”每经记者向深度求索公司发出采访请求，截至发稿，尚未收到回复。针对DeepSeek-V3，独立评测网站ArtificialAnlaysis就关键指标——包括质量、价格、性能（每秒生成的Token数以及首个Token生成时间）、上下文窗口等多方面——与其他人工智能模型进行对比，最终得出以下结论。质量：Deep... 2
中非经贸合作展现强劲活力（新时代中非合作）

-代码生成
 +谷歌 +引擎
 +游戏 +战士

08-30 01:30...中国已连续15年保持非洲第一大贸易伙伴国地位。近年来，中非经贸合作规模不断扩大，贸易结构持续优化。“当前非中经贸合作不断深入、富有成效、充满活力。”埃及“国家回声网”如是评价。非洲国家对华农产品出口扩大是一大亮点。2023年，中国从非洲进口的坚果、蔬菜、花卉和水果分别同比增长130%、32%、14%和7%。南非鲜梨、坦... 1
谷歌推世界首个 AI 游戏引擎 GameNGen：0 代码生成《毁灭战士》，有望颠覆 2000 亿美元产业

+游戏 +引擎
 +模型 +谷歌
 +神经网络

08-30 01:30...最后JimFan总结道：不管怎么说，GameNGen仍是一个非常出色的概念验证——至少我们现在知道，9亿帧是将高分辨率DOOM压缩到神经网络中的上限。网友们感慨：扩散网络学习物理引擎和游戏规则的方式，太疯狂了。核心作者：个人里程碑谷歌DeepMind核心贡献者，项目负责人ShlomiFruchter，在社交媒体上，介绍... 0
Mistral新旗舰决战Llama 3.1！最强开源Large 2 123B，扛鼎多语言编程全能王

+模型 +开源
 +基准 +测试
 +语言

07-25 10:30...和Llama370B比，它性能好。推特网友惊呼，「开源AI就这么卷起来了吗！」短短一周时间内，GPT-4omini、Llama3.1、MistralLarge2相继发布，有些让人应接不暇。「我躺了，你们先卷着。」但躺平阵营中绝对不包含ollama。前脚Mistral刚官宣，这边就火速更新。果然，参数量砍去一大半之后，本... 3
大模型“自学”后能力反下降，Llama/Mistral都没逃过

+能力 +训练
 +答案 +模型
 +数学

07-19 10:50...刷分更高但是能力下降具体说来，该工作将”迭代后训练”（Iterativepost-training）分成三个主要步骤：答案采样：让AI回答一系列问题，每个问题回答多次。训练集构建：从AI的回答中挑选出好的答案。模型后训练：用这些好答案来”教”AI，让它学会更好的回答方式。研究人员尝试了不同的”教学”方法：迭代SFT：直... 0
明星AI独角兽Mistral AI亮出大模型新王炸，代码和数学能力超群

+模型
 +明星 +能力
 -代码生成 +开源

07-17 20:00...一、代码生成模型能够处理更长的上下文资金雄厚的法国AI初创公司MistralAI以其强大的开源AI模型而闻名，如今在其不断增长的大型语言模型（LLM）系列中推出了两个新条目：一个基于数学的模型和一个面向程序员和开发人员的代码生成模型，该模型基于其他研究人员去年年底开发的新架构Mamba。Mamba试图通过简化其注意力机... 3
大降数字孪生模拟成本，NVIDIA晒助攻科学研究新进展！加速全球量子计算超算

+全球 +量子
 +超级计算机 +研究
 +模型

05-16 20:00...用于代码生成、天气预测、生成基因、新药研发、新型材料开发等。在代码生成方面，桑迪亚国家实验室正在构建一个大语言模型智能助手Kokkos，用来自动生成并行计算代码。这个专门的编程语言由多个国家实验室的研究人员开发，可处理在超级计算机的数万个处理器上运行任务时出现的细微差别。桑迪亚实验室正利用检索增强生成（RAG）技术创建... 8
科学家建立新评价基准Tapilot

+模型
 -代码生成 +数据
 +代码 +基准

04-06 23:10...以确保避免假阴性的发生。同时，他们还从模型的角度出发来思考问题，思考为什么模型犯这样的错误，以及该怎样避免。此外，他们也探索了到底使用哪些方法，能让模型更加关注对于当前问题有价值的历史信息，以便最大程度地满足用户预期。研究中，他们使用各种大型语言模型来执行本次任务，每一个大型语言模型在解决复杂问题时，都展现出了独特的个... 0
刘和平：遭恐袭后升级对乌打击普京下一步怎么走？

+模型
 -代码生成 +小扎
 +挖角 +开源

03-26 21:50...俄外交部发言人扎哈罗娃还提出了一个疑问，那就是为什么以前“伊斯兰国”极端组织将美国当成了头号袭击对象，但是现在却将美国的敌人和对手，包括阿富汗塔利班、叙利亚政府、伊朗以及俄罗斯当成了袭击对象？其言下之意就是，“伊斯兰国”极端组织对莫斯科音乐厅的恐袭是受美国所指使的。那么，我们究竟要如何来看待美俄在基本事实问题上各说各话... 0
曝小扎写信“挖角”DeepMind；我国10亿级参数大模型超百个；Stability AI开源代码生成模型丨AIGC大事日报

+模型 +英特尔
 +商用 -代码生成
 +混元

03-26 21:50...DeepMind也向部分研究人员提供了价值数百万美元的限制性股票。公开资料显示，在去年7月发表的Llama2论文的68位作者中，至少有10人已离开Meta；去年2月的Llama论文的14位作者中，至少有7人已离职；参与即将推出的Llama3的研究人员也有些选择离开，包括负责安全事务的LouisMartin和负责强化学习... 1
全球最强大模型易主树立新的行业基准

+模型
 +基准 +易主
 +表现出色 +全球

03-05 19:30...Claude3系列包括Claude3Haiku、Claude3Sonnet和Claude3Opus，能力逐级增强。Opus作为最先进模型，在多项评估标准上领先同行，展现出几乎与人类相媲美的理解和表达能力，是AGI领域的领跑者。Claude3在分析预测、代码生成、多语言理解和视觉识别等方面实现了显著进步。Opus在处理复... 0
马斯克推出首个AI大模型：善于讽刺，只训练了两个月，部分超越GPT3.5

+马斯克 +模型
 +准确率 +训练
 +计划

11-06 08:40...是xAI团队在过去4个月内运用前沿技术开发的大语言模型。在过去的2个月内，Grok-1的研发取得了突破，Grok-1目前在HumanEval代码生成任务上取得了63.2%的准确率，在MMLU数据集测试中取得了73%的准确率。马斯克在X上宣布，结束初期测试阶段后，Grok将被包含在X的Premium+订阅计划中，该计划的... 1

« 1 »