首个多模态连续学习综述，港中文、清华、UIC联合发布,微调

首个多模态连续学习综述，港中文、清华、UIC联合发布

+模态 +方法
 +训练 +任务
 +参数

11-13 14:50...MMCL的多模态性质还带来了以下四个挑战。挑战1模态失衡：模态失衡是指多模态系统中不同模态的处理或表示不均衡，表现在数据和参数两个层面。在数据层面，不同模态的数据可用性可能会在CL过程中发生显著变化，出现极度不平衡的情况，如缺乏某些模态。在参数层面，不同模态组件的学习可能会以不同的速度收敛，从而导致所有模态的学习过程整... 1
进一步争夺B端市场！OpenAI将允许企业用户个性化GPT

+模型
 +个性化 -微调
 +数据 +营收

08-24 00:30...OpenAI推出了面向大型企业的ChatGPT企业版（ChatGPTEnterprise）。据OpenAI介绍，除了和一般ChatGPT一样执行编写电邮、起草文件和调试电脑代码等任务外，当时的企业版还可提供企业级的安全和隐私，以及高级数据分析功能。外媒分析称，ChatGPTEnterprise的推出意味着，OpenAI... 0
OpenAI发布新功能允许企业客户定制最强AI模型

+人工智能
 +模型 +功能
 -微调 +数据安全

08-20 22:00...微调允许现有的人工智能模型在特定任务或主题领域的额外信息上进行训练。这项功能是OpenAI旗舰模型的新功能，此外，该公司还允许用户对许多其他型号进行微调，包括GPT-4omini，这是GPT-4o的更便宜、更精简的版本。在过去几个月里，OpenAI已经与合作伙伴对微调功能进行了测试，并且取得了一系列成果。比如，初创公司... 0
小模型卷起来了：Mistral联合英伟达开源12B小模型，128k上下文

+模型 +分词器
 -微调 +开源
 +训练

07-19 11:20...由于MistralNeMo依赖于标准架构，因此易于使用，可在任何使用Mistral7B的系统中成为替代品。下表比较了MistralNeMo基本模型与两个最新的开源预训练模型（Gemma29B和Llama38B）的准确性。（严格来讲，这个对比不太公平，毕竟MistralNeMo的参数量比另外两个都要大不少）表1：Mist... 0
明星AI独角兽Mistral AI亮出大模型新王炸，代码和数学能力超群

+模型
 +明星 +能力
 +代码生成 +开源

07-17 20:00...一、代码生成模型能够处理更长的上下文资金雄厚的法国AI初创公司MistralAI以其强大的开源AI模型而闻名，如今在其不断增长的大型语言模型（LLM）系列中推出了两个新条目：一个基于数学的模型和一个面向程序员和开发人员的代码生成模型，该模型基于其他研究人员去年年底开发的新架构Mamba。Mamba试图通过简化其注意力机... 2
清华北航博士生「强迫」Gemma

-微调
 +中文 +模型
 +角色扮演 +博士生

07-06 19:30...严重影响了我们用中文和AI机器人好好聊天。最近发布的Gemma2模型虽然既开源又强悍，但比较遗憾的是，其中文水平相较英文水平还有一定的距离。不过，我们可以用微调来解决，Fine-tuneit！7月1日，Gemma2刚发布4天，清华大学的一名人工智能博士生王慎执就在X上隆重推出了一款微调模型Gemma-2-9B-Chin... 0
欧盟拟微调中国电动汽车关税?中国车企：不放弃欧盟市场

+电动汽车
 +关税 +欧洲
 -微调 +王晓秋

07-01 21:00...上汽集团：将以全球产销布局平衡波动“上汽集团将通过包括中东、东南亚在内的全球产销布局来平衡欧盟市场可能出现的波动。”在6月28日举行的上汽集团2023年度股东大会上，上汽集团总裁王晓秋针对欧盟大幅加征中国车企反补贴关税时表示，上汽集团肯定不会放弃欧盟市场，电动汽车还是要往欧洲卖。“未来肯定要去欧洲建厂，3年以后，我们的... 2
@高考生，志愿填报由7次调整为6次！山东高考录取政策有多处微调

-微调 +山东
 +志愿 +政策
 +高考

06-11 15:50...普通类共设有提前批、特殊类型批、常规批等录取批次，其中特殊类型批仅保留高校专项计划（本科）招生类型，以往在该批次录取的高校高水平艺术团招生类型今年起正式取消。普通类常规批首次增加了文物全科人才招生类型，该类型招生志愿包含在96个志愿之内，考生可在常规批第1次志愿填报时填报，若第1次志愿录取完成后仍有剩余计划，可在常规批... 7
LoRA数学编程任务不敌全量微调

-微调 +全量
 +任务 +矩阵
 +编程

05-21 03:10...监督微调实验则是在训练1、2、4、8、16个epochs时取样；LoRA的rank取值为16和256，适配对象包括Attention、MLP和All。结果不难看出，无论是持续预训练还是监督微调，LoRA在编程上的表现从未追上过全量微调，而且在持续预训练中，随着token数量的增加，差距越来越悬殊。而在数学任务上的持续预... 3
苹果进击AI Phone

+模型 +苹果
 +手机 +厂商
 +开源

05-05 21:00...相比目前大多数8B左右的模型，其对芯片的要求也更低一些。但在大模型能力上，苹果表示，与1.2B参数的OLMo模型相比，1.1B参数的OpenELM准确率高出2但预训练需要的token数量却只有OLMo的一半。相比此前苹果已经公布的MM1多模态大语言模型，此次发布的OpenELM不仅体量更小，其最受人关注的一点在于，这系... 0
又变啦！2024秋季新初一语文教材变化不小

 +教材
 +课程标准 +语文
 +课文 +课程

04-23 03:20...已经不能适用于当前对培养未来具有正确的价值观、必备品格和关键能力的社会主义建设者和接班人。按照教育部《中小学教材管理办法》规定，“教材实行周期修订制度，一般按学制周期修订”，当课程标准发生变化时，教材应及时修订。2022年4月，新版课程标准发布，这预示着2024年秋季中小学各年级教材都将以全新面孔出现。但这次修订，是大... 7
首个基于Mamba的MLLM来了！模型权重、训练代码等已全部开源

+模型
 +语言 +视觉
 +模态 +开源

04-23 00:40...即在保持基于注意力的Transformer结构不变的情况下减少基础语言模型的参数或视觉token的数量。本文提出了一个不同的视角：直接采用状态空间模型（SSM）作为骨干网络，得到了一种线性计算复杂度的MLLM。此外，本文还探索和研究了各种模态融合方案，以创建一个有效的多模态Mamba。具体来说，本文采用Mamba语言模... 1
Llama 3每秒输出800个token逼宫openAI！下周奥特曼生日或放出GPT

+模型 +开源
 +奥特曼 +测试
 -微调

04-21 07:00...AI社区研究者们已经疯狂开启了对Llama3的测试、微调。Reddit网友使用Llama370B，非常轻易地制作了一个完美的「贪吃蛇」游戏，并且在苹果测试中表现优秀。但最令人振奋的是，这个模型可以进行微调。它绝对会疯狂发展。任何中小型公司都可以利用Llama3400B将生产力提升到空前水平。还有人通过HFChat使用葡... 1
首批基金一季报出炉持仓结构现微调

+结构 +基金
 +A股 +仓位
 +混合

04-17 12:50...中庚价值灵动灵活配置、中庚小盘价值分别小幅减仓4.55个百分点、3.73个百分点。此外，中庚价值领航略微增加了港股仓位，从去年四季度末的43.57%升至44.72%，而中庚价值品质一年持有、中庚港股通价值18个月封闭在今年一季度均小幅减少港股仓位。基金经理积极调仓从持仓情况来看，目前披露一季报的基金产品中，大部分主要投... 0
广发证券董事会换届微调，60岁董事长留任，58岁副董事长离席

-微调
 +广发 +证券
 +葛长伟 +董事会

04-17 10:10...1994年至2010年先后历任广发证券北京建华南路营业部交易员、办公室文员、行政部副总经理、行政部总经理、办公室总经理、兼并收购部总经理、投行业务管理总部副总经理等职务。2010年7月，肖雪生调任广发信德投资管理有限公司（简称“广发信德”）董事，不久任该公司总经理，2021年9月任董事长。广发信德是广发证券的全资私募基... 12
人民币基金“微调”：机构LP份额转让增多 S交易成退出渠道重要补充

+交易 +基金
 +市场 +国资
 +股权

03-31 04:00...随着市场的发展和投资者（LP）对流动性需求的增加，二级市场交易的比重有增长的趋势。特别是在市场不确定性增加或者IPO市场不景气的时候，二级市场交易作为一种提供流动性的渠道，可能会变得更加重要。此外，随着越来越多的机构投资者参与到私募股权市场中，二级市场交易的活跃度和占比也可能会随之增加。退出管理同样是中国股权投资市场的... 0
英伟达黄仁勋叠BUFF！在家就能微调大模型、一键构建元宇宙，GH200大幅降低大语言模型推理成本！

+黄仁勋 +模型
 +一键 +成本
 -微调

08-09 05:10...“在计算的未来，加速计算和AI计算将成为主流。”黄仁勋信心满满的展望道。在能源效率和成本效益方面，黄仁勋反复强调：“买的越多，省得越多”。这可不是“信口开河”，加速计算在生成式AI应用程序的能源效率和成本效益方面相当于20倍的Moore定律和目前的CPU扩展方式。Moore定律是由英特尔创始人之一戈登·摩尔提出的观点。... 3
回国备战巴黎奥运会资格赛中国女排阵容或将微调

+奥运会
 -微调 +回国
 +巴黎 +二传手

07-21 10:40...在今年世界女排联赛的三周分站赛以及总决赛阶段，中国女排在总计15场比赛中使用了完全相同的14人阵容，包括主攻手李盈莹、王云蕗、仲慧、杜清清，副攻手袁心玥、王媛媛、杨涵玉、高意，二传手刁琳宇、许晓婷，接应二传手龚翔宇、郑益昕以及自由人王梦洁和倪非凡。在主力阵容方面，中国队经过去年世界女排联赛和世界女排锦标赛的实战锻炼后，... 8
Lisa的鼻子需要二次修复吗？

+鼻翼
 +假性 +鼻尖
 +鼻子 +基底

07-10 15:10...应该如何微调？怎么才能避免鼻基底术后鼻翼变宽？羊今天就来跟姐妹们一次讲清、讲透这两个重要的鼻部美学单位真假宽鼻翼还是以Lisa为案例，很多人说她的鼻子需要修复缩更窄，羊反而觉得她没有过度缩鼻翼才是最明智的微调。一方面，她眼睛大、眼距宽、面部软组织丰厚，气质偏甜，如果鼻翼过窄反而会不协调。另一方面很多人都忽略了，Lisa... 2
楼语纵横/适时微调按揭重建换楼阶梯世纪21．Q动力总经理杨永健

+新盘 -微调
 +总经理 +动力
 +世纪

07-04 03:30...加之上月新盘以中小型住宅为主，令销售金额大幅回落。整体而言，新盘市场今年上半年可谓“阴晴不定”，曾经一度相当热闹，两、三个大型新盘同期登场，但亦“时吹淡风”。保守估计，上半年新盘销售相信只有6300伙左右。虽然较去年同期4785伙回升三成以上，但仍然不及2021年以至2020年疫情期间的水平。换言之，即使疫情过去，但新... 7
医联发布国内首款医疗大语言模型 MedGPT

+国内 +模型
 +首款 +医学
 +医疗

05-25 12:40...通过独有的将⾃然语⾔⼤模型AI技术与⼀系列⼯程调优技术以及医学⼀致性校验技术相结合，并在模型微调训练阶段采⽤⼤量真实医⽣参与的RLHF（ReinforcementLearningfromHumanFeedback)监督微调，有效提升模型的疾病特征判断与模式识别能⼒，确保医疗准确性。医联还建立了基于专家评议的AI诊疗准确... 19
AI群聊出现！用50万条真人聊天记录训练，个性十足年代感稍弱

+聊天记录
 +个性 +真人
 +训练 +人工智能

04-14 10:20...而不仅仅是模仿我们说话的方式。它知道我们在和谁约会，我们在哪里上的学，我们的住址是什么，等等。”米勒说。虽然这一项目得益于人工智能的最新进展，但并不是任何人都能完成的。米勒是一名数据科学家，已经研究这类技术有一段时间。他目前就职于一家名为Hex的初创公司，该公司恰好提供有助于这类项目的工具。他在一篇博客文章中描述了这项... 12

« 1 2 3 »