原生支持DeepSeek，国内70%部署企业基于昇腾快速上线,微调

原生支持DeepSeek，国内70%部署企业基于昇腾快速上线

+国内
 +模型 +算力
 +训练 +优化

02-18 23:10...大模型呈现“技术摸高+工程创新”并行发展趋势，算力需求仍将持续增长。技术摸高方面，头部企业坚定投入预训练基础模型创新，追逐ScalingLaw，加速探索AGI。他们关注高效、稳定、开放的底座，极致性能、稳定可靠的AI集群，以及深度开放的平台和生态。例如，Meta的AI投资从400亿美元增加到650亿美元，谷歌从525亿... 1
探访北京西站周边春运交通：微调措施缓解交通拥堵

-微调
 +措施 +北京西站
 +车辆 +交通

01-28 03:10...丰台交通支队丰北大队副大队长金辉现场向记者介绍。在北京西站北广场东侧的公交场站内，五条公交车道腾退出来两条，现今被用作社会车辆和网约车的接驳区。车辆穿过P6停车场，可以直接开到广场入口处，在这里接送客人又快又方便。记者现场看到，目前来这里接送客的车辆并不多。此处接驳区是前段时间刚刚开辟的，很多司机可能还不知道。也有网约... 3
全球掀DeepSeek复现狂潮！硅谷巨头神话崩塌，30刀见证啊哈时刻

+模型 +训练
 +奖励 +狂潮
 +研究者

01-27 02:40...5-Base（0.5B、1.5B、3B、7B四种参数规模）。结果发现，0.5B模型仅仅是猜测一个解决方案然后停止。而从1.5B开始，模型学会了搜索、自我验证和修正其解决方案，从而能够获得更高的分数。他们认为，在这个过程，基础模型的是性能的关键。他们还验证了，额外的指令微调（SFT）并非是必要的，这也印证了R1-Zero... 6
紫云府居隐入尘烟

+尘烟 +紫云
 +设计师 +手饰
 +女业主

01-02 06:00...所以空间风格上要求简洁朴素自然设计师：杨素未度设计设计师首先是解决功能性问题，在大部分都拆改不了的格局上做微调和合理利用。其次是用最少的设计语言来表达场景的氛围。女业主单身不婚，需要把家改造成居住与工作室相容，兼手饰展示空间，因为业主是做民族手饰设计师，所以空间风格上要求简洁朴素自然设计师：杨素未度设计设计师首先是解决... 4
OpenAI向第三方开发者开放最强大模型o1

+模型 +开发者
 -微调 +语音
 +场景

12-18 07:20...OpenAI还在今天的发布会上公布了对其RealtimeAPI的重大更新，包括价格下调及一种全新的微调方法，赋予开发者更高的模型控制能力。1.o1模型现已通过API向开发者开放新版o1模型（版本号：o1-2024-12-17）在复杂且多步推理任务中表现出色。与此前的o1-preview版本相比，该版本在准确性、效率和灵... 0
深圳市前海管理局关于玖尚公寓施工图修改备案的公示

+公寓
 +深圳 +局部
 +施工图 +管理局

11-27 20:30...根据本项目《建设用地规划许可证》（深前海许QH-2020-0010号），本宗地总用地面积9378.68平方米，总建筑面积21850平方米，其中公寓式办公建筑（商务公寓）18000平方米（含物业管理用房100平方米）、商业建筑3100平方米、公共配套设施750平方米（其中包括社区管理用房300平方米、社区便民服务站400... 5
首个多模态连续学习综述，港中文、清华、UIC联合发布

+模态 +方法
 +训练 +任务
 +参数

11-13 14:50...MMCL的多模态性质还带来了以下四个挑战。挑战1模态失衡：模态失衡是指多模态系统中不同模态的处理或表示不均衡，表现在数据和参数两个层面。在数据层面，不同模态的数据可用性可能会在CL过程中发生显著变化，出现极度不平衡的情况，如缺乏某些模态。在参数层面，不同模态组件的学习可能会以不同的速度收敛，从而导致所有模态的学习过程整... 6
进一步争夺B端市场！OpenAI将允许企业用户个性化GPT

+模型
 +个性化 -微调
 +数据 +营收

08-24 00:30...OpenAI推出了面向大型企业的ChatGPT企业版（ChatGPTEnterprise）。据OpenAI介绍，除了和一般ChatGPT一样执行编写电邮、起草文件和调试电脑代码等任务外，当时的企业版还可提供企业级的安全和隐私，以及高级数据分析功能。外媒分析称，ChatGPTEnterprise的推出意味着，OpenAI... 1
OpenAI发布新功能允许企业客户定制最强AI模型

+人工智能
 +模型 +功能
 -微调 +数据安全

08-20 22:00...微调允许现有的人工智能模型在特定任务或主题领域的额外信息上进行训练。这项功能是OpenAI旗舰模型的新功能，此外，该公司还允许用户对许多其他型号进行微调，包括GPT-4omini，这是GPT-4o的更便宜、更精简的版本。在过去几个月里，OpenAI已经与合作伙伴对微调功能进行了测试，并且取得了一系列成果。比如，初创公司... 0
小模型卷起来了：Mistral联合英伟达开源12B小模型，128k上下文

+模型 +分词器
 -微调 +开源
 +训练

07-19 11:20...由于MistralNeMo依赖于标准架构，因此易于使用，可在任何使用Mistral7B的系统中成为替代品。下表比较了MistralNeMo基本模型与两个最新的开源预训练模型（Gemma29B和Llama38B）的准确性。（严格来讲，这个对比不太公平，毕竟MistralNeMo的参数量比另外两个都要大不少）表1：Mist... 1
明星AI独角兽Mistral AI亮出大模型新王炸，代码和数学能力超群

+模型
 +明星 +能力
 +代码生成 +开源

07-17 20:00...一、代码生成模型能够处理更长的上下文资金雄厚的法国AI初创公司MistralAI以其强大的开源AI模型而闻名，如今在其不断增长的大型语言模型（LLM）系列中推出了两个新条目：一个基于数学的模型和一个面向程序员和开发人员的代码生成模型，该模型基于其他研究人员去年年底开发的新架构Mamba。Mamba试图通过简化其注意力机... 5
清华北航博士生「强迫」Gemma

-微调
 +中文 +模型
 +角色扮演 +博士生

07-06 19:30...严重影响了我们用中文和AI机器人好好聊天。最近发布的Gemma2模型虽然既开源又强悍，但比较遗憾的是，其中文水平相较英文水平还有一定的距离。不过，我们可以用微调来解决，Fine-tuneit！7月1日，Gemma2刚发布4天，清华大学的一名人工智能博士生王慎执就在X上隆重推出了一款微调模型Gemma-2-9B-Chin... 1
欧盟拟微调中国电动汽车关税?中国车企：不放弃欧盟市场

+电动汽车
 +关税 +欧洲
 -微调 +王晓秋

07-01 21:00...上汽集团：将以全球产销布局平衡波动“上汽集团将通过包括中东、东南亚在内的全球产销布局来平衡欧盟市场可能出现的波动。”在6月28日举行的上汽集团2023年度股东大会上，上汽集团总裁王晓秋针对欧盟大幅加征中国车企反补贴关税时表示，上汽集团肯定不会放弃欧盟市场，电动汽车还是要往欧洲卖。“未来肯定要去欧洲建厂，3年以后，我们的... 4
@高考生，志愿填报由7次调整为6次！山东高考录取政策有多处微调

-微调 +山东
 +志愿 +政策
 +高考

06-11 15:50...普通类共设有提前批、特殊类型批、常规批等录取批次，其中特殊类型批仅保留高校专项计划（本科）招生类型，以往在该批次录取的高校高水平艺术团招生类型今年起正式取消。普通类常规批首次增加了文物全科人才招生类型，该类型招生志愿包含在96个志愿之内，考生可在常规批第1次志愿填报时填报，若第1次志愿录取完成后仍有剩余计划，可在常规批... 9
LoRA数学编程任务不敌全量微调

-微调 +全量
 +任务 +矩阵
 +编程

05-21 03:10...监督微调实验则是在训练1、2、4、8、16个epochs时取样；LoRA的rank取值为16和256，适配对象包括Attention、MLP和All。结果不难看出，无论是持续预训练还是监督微调，LoRA在编程上的表现从未追上过全量微调，而且在持续预训练中，随着token数量的增加，差距越来越悬殊。而在数学任务上的持续预... 3
苹果进击AI Phone

+模型 +苹果
 +手机 +厂商
 +开源

05-05 21:00...相比目前大多数8B左右的模型，其对芯片的要求也更低一些。但在大模型能力上，苹果表示，与1.2B参数的OLMo模型相比，1.1B参数的OpenELM准确率高出2但预训练需要的token数量却只有OLMo的一半。相比此前苹果已经公布的MM1多模态大语言模型，此次发布的OpenELM不仅体量更小，其最受人关注的一点在于，这系... 0
又变啦！2024秋季新初一语文教材变化不小

 +教材
 +课程标准 +语文
 +课文 +课程

04-23 03:20...已经不能适用于当前对培养未来具有正确的价值观、必备品格和关键能力的社会主义建设者和接班人。按照教育部《中小学教材管理办法》规定，“教材实行周期修订制度，一般按学制周期修订”，当课程标准发生变化时，教材应及时修订。2022年4月，新版课程标准发布，这预示着2024年秋季中小学各年级教材都将以全新面孔出现。但这次修订，是大... 8
ChatGPT发布一周年了，开源大模型都迎头赶上了吗？

+开源
 +模型 +指令
 +文本 -微调

11-30 07:50...并在回答需要结合专业知识的问题上超过了ChatGPT的表现。II.具体任务上超越ChatGPT的开源大模型1.AI智能体（Agent）Lemur-70B-chat团队探索了训练数据中代码和文本更优的配比。通过在包含90BToken和300K示例的代码-文本混合语料上进行训练和指令微调，Lemur-70B-chat在能够... 1
英伟达黄仁勋叠BUFF！在家就能微调大模型、一键构建元宇宙，GH200大幅降低大语言模型推理成本！

+黄仁勋 +模型
 +一键 +成本
 -微调

08-09 05:10...“在计算的未来，加速计算和AI计算将成为主流。”黄仁勋信心满满的展望道。在能源效率和成本效益方面，黄仁勋反复强调：“买的越多，省得越多”。这可不是“信口开河”，加速计算在生成式AI应用程序的能源效率和成本效益方面相当于20倍的Moore定律和目前的CPU扩展方式。Moore定律是由英特尔创始人之一戈登·摩尔提出的观点。... 4
回国备战巴黎奥运会资格赛中国女排阵容或将微调

+奥运会
 -微调 +回国
 +巴黎 +二传手

07-21 10:40...在今年世界女排联赛的三周分站赛以及总决赛阶段，中国女排在总计15场比赛中使用了完全相同的14人阵容，包括主攻手李盈莹、王云蕗、仲慧、杜清清，副攻手袁心玥、王媛媛、杨涵玉、高意，二传手刁琳宇、许晓婷，接应二传手龚翔宇、郑益昕以及自由人王梦洁和倪非凡。在主力阵容方面，中国队经过去年世界女排联赛和世界女排锦标赛的实战锻炼后，... 13
楼语纵横/适时微调按揭重建换楼阶梯世纪21．Q动力总经理杨永健

+新盘 -微调
 +总经理 +动力
 +世纪

07-04 03:30...加之上月新盘以中小型住宅为主，令销售金额大幅回落。整体而言，新盘市场今年上半年可谓“阴晴不定”，曾经一度相当热闹，两、三个大型新盘同期登场，但亦“时吹淡风”。保守估计，上半年新盘销售相信只有6300伙左右。虽然较去年同期4785伙回升三成以上，但仍然不及2021年以至2020年疫情期间的水平。换言之，即使疫情过去，但新... 11
医联发布国内首款医疗大语言模型 MedGPT

+国内 +模型
 +首款 +医学
 +医疗

05-25 12:40...通过独有的将⾃然语⾔⼤模型AI技术与⼀系列⼯程调优技术以及医学⼀致性校验技术相结合，并在模型微调训练阶段采⽤⼤量真实医⽣参与的RLHF（ReinforcementLearningfromHumanFeedback)监督微调，有效提升模型的疾病特征判断与模式识别能⼒，确保医疗准确性。医联还建立了基于专家评议的AI诊疗准确... 19

« 1 2 3 »