国内首家！阿里云全方位支持Llama 3训练推理：提供免费算力,模型,训练

国内首家！阿里云全方位支持Llama 3训练推理：提供免费算力

-训练
 -模型 +算力
 +云百炼 +开发者

04-23 00:40...无需担心繁琐的训练和部署流程。Llama3作为Meta推出的新一代开源大语言模型，其80亿及700亿参数版本均展现出了强大的性能。然而，对于特定语言或垂直领域的需求，通常需要对这些开源模型进行进一步的训练或微调。这一过程在过去可能较为复杂，但现在，阿里云百炼平台提供的一键式解决方案让这一切变得简单。阿里云百炼平台不仅提... 0
走近全球汽车产业链上的中国创新

 +词表 +开源
 +结构 +西湖
 +蛋白

04-22 05:30...新华社记者许畅摄一条新能源汽车轮胎与传统汽车轮胎有什么不同？在著名轮胎制造商德国大陆马牌轮胎设在安徽省合肥市的生产基地，负责人耐心地向记者解释，相比传统汽车，新能源汽车对轮胎噪音和抓地力要求更高，在轮胎滚阻、耐磨性等指标上都提出新要求。大陆马牌在华研发团队开发了针对中国市场实际需求的新能源汽车专款轮胎，并同步到大陆马牌... 0
4000万蛋白结构训练，西湖大学开发基于结构词表的蛋白质通用大模型，已开源

+结构
 +蛋白质 +词表
 -模型 -训练

04-22 05:30...生成了一维的3Di结构序列（使用了Foldseek的结构词表，每种3Ditoken代表不同的局部结构），这样的结构序列与氨基酸序列是等长的。因此本文使用了一种简单而有效的结构嵌入方式：将结构词表和氨基酸词表计算笛卡尔积（即两两组合），形成新的结构感知词表。这样对于蛋白质的每个位点，其氨基酸类型和对应的局部结构都能组合成... 0
大模型一定就比小模型好？谷歌的这项研究说不一定

-模型
 -训练 +文生
 +性能 +效率

04-22 05:20...该团队发现计算资源和LDM性能之间存在明显联系。这表明随着模型增大，还有潜力实现进一步提升。下游性能会随预训练而扩展。该团队的实验表明：预训练性能与在下游任务上的成功之间存在很强的关联。较小模型即使使用额外的训练也无法完全赶上较大模型的预训练质量所带来的优势。较小模型的采样效率更高。当给定了采样预算时，较小模型的图像质... 0
深圳数据交易所首发500个垂直行业数据集给人工智能提供训练数据

+数据 +人工智能
 +算料 +深圳
 -训练

04-21 18:20...深圳数据交易所（以下简称“深数所”）人工智能行业主管王吴越进行了主旨发言，并展示了深数所助力粤港澳大湾区人工智能训练场建设的行业实践。王吴越表示，在数字经济时代，“数据要素×”与“人工智能+”成为推动新质生产力的双轮驱动，共同引领着经济社会的进步与发展。数据作为一个高效的“乘法”因子，能够与不同行业结合，显著提升行业的... 0
让大模型更具行业黏性

-模型
 +黏性 +行业
 -训练 +场景

04-15 19:40...各行各业要将大模型强大的技术能力运用好，需要企业有一系列周边能力来正确、合理、安全、高效地使用大模型。要获得能够落地各行各业的大模型，首先要有强大的基础模型，之后再结合场景开展与业务结合的相关训练。为此，亚马逊云科技与美国人工智能企业Anthropic开展合作，对Claude3系列模型进行训练。当前，该模型在复杂任务中... 0
人工智能领域的关键挑战：高质量的训练数据处理能力

+人工智能 +数据
 -模型 -训练
 +高质量

04-13 22:30...在近日举办的2024北京AI原生产业创新大会上,北京金控集团董事长、北京国际大数据交易所董事长范文仲在发布会上发言指出,当前,我国人工智能的发展需要突破两大瓶颈问题,一是缺乏高质量的训练数据,二是缺乏满足智能运算要求的算力。他表示,从数据来看,人工智能大模型的训练越来越依赖高质量数据集的提供。企业要发展人工智能技术,往... 0
报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT

-训练 +数据
 -模型 +泰晤士报

04-09 00:40...OpenAI在2021年耗尽了有用的数据供应，并在耗尽其他资源后讨论了转录YouTube视频、播客和有声读物的可行性。此外，OpenAI使用了包括来自Github的计算机代码、国际象棋走棋数据库和来自Quizlet的作业内容。据报道，OpenAI公司知道这在法律上存在问题，但认为这是合理使用。《泰晤士报》则透露，Ope... 0
腾讯云AIGC存储解决方案升级，数据清洗和训练耗时缩短一半

+数据 -训练
 -模型 +解决方案
 +场景

04-09 00:40...AI大模型的研发生产流程，分成数据采集与清洗、模型训练、推理三大环节，各环节都涉及海量的数据处理。在数据采集与清洗环节，由于原始训练数据规模海量，且来源多样，对存储技术提出了多协议支持、高性能、大带宽的需求。腾讯云存储总经理马文霜表示，“在数据采集阶段我们基于海量的对象存储引擎提供高性价比的数据湖服务，让原始数据可以方... 0
搞AI的是真没钱了

-模型 +架构
 -训练 +专家
 +成本

04-09 00:10...当下对其GPT-4技术猜测的主流观点也认为，他们一定采用了MoE架构。MoE不太省心，但确实可以降本MoE架构的中文名称是混合专家架构，是神经网络的一种架构模式。它将神经网络拆分成多个专家子网络，面对一次输入，既可以指定某一位“专家”来回答，也可以要求多位“专家”回答，甚至全部参与回答，最终依据权重综合给出结果。这使得... 0
大模型开启新赛季，腾讯云存储升级：已有80%头部厂商采用

+数据 -模型
 -训练 +厂商
 +环节

04-09 00:00...能够针对AI大模型数据采集清洗、训练、推理、数据治理全流程提供全面、高效的云存储支持。数据显示，采用腾讯云AIGC云存储解决方案，可将大模型的数据清洗和训练效率均提升一倍，需要的时间缩短一半。AI大模型的研发生产流程主要分成数据采集与清洗、模型训练、推理三大环节，各环节都涉及海量的数据处理。在数据采集与清洗环节，由于原... 0
为训练AI，OpenAI等科技巨头花式淘数据

+文化节 +市民
 +方式 +上海
 +花式

04-08 20:20...OpenAI等科技巨头花式淘数据2024年04月08日08:14来源：环球时报[][字号][]【环球时报特约记者甄翔】《纽约时报》6日披露了科技公司训练人工智能的秘密——利用语音识别工具转录视频网站YouTube上的视频，形成对话文本数据，供其最新的AI学习。这是一条违反法律的“捷径”。报道称，早在2021年年底，Op... 0
迄今最快AI芯片拥有4万亿个晶体管

+芯片
 +超级计算机 +晶体管
 +秃鹰 +银河

04-05 19:40...未来也有望用于目前正在建设中的秃鹰银河3号AI超级计算机。WSE-3芯片由90万个经AI优化的计算核心组成，集成在一块88.5英寸的硅晶圆上，类似其前身WSE-2。该公司在13日发布的一份新闻稿中表示，WSE-3的功耗和价格与WSE-2相当，但功率是其两倍。WSE-2包括2.6万亿个晶体管和85万个AI核心。目前用于训... 12
需要更多数据训练 OpenAI放开限制

+人工智能
 +数据 -训练
 -模型 +高质量

04-02 19:10...其为使用ChatGPT的未注册用户引入了额外的内容保护措施，例如阻止提示和更广泛类别的生成。同时，OpenAI不忘提示称，“创建账户有很多好处，包括能够保存和查看聊天历史记录、共享聊天以及解锁语音对话和自定义指令等附加功能”。也就是说，无论用户是否注册使用ChatGPT，用户在使用过程中产生的数据都可能会被OpenAI... 0
迄今最快AI芯片拥有4万亿个晶体管

+芯片
 +超级计算机 +晶体管
 +秃鹰 +银河

03-28 09:40...未来也有望用于目前正在建设中的秃鹰银河3号AI超级计算机。WSE-3芯片由90万个经AI优化的计算核心组成，集成在一块88.5英寸的硅晶圆上，类似其前身WSE-2。该公司在13日发布的一份新闻稿中表示，WSE-3的功耗和价格与WSE-2相当，但功率是其两倍。WSE-2包括2.6万亿个晶体管和85万个AI核心。目前用于训... 0
马斯克起诉OpenAI的18天后，Grok开源了

 +开源 -模型
 +马斯克 -训练
 +权重

03-26 15:50...xAI将开源聊天机器人Grok”3月11日晚特斯拉创始人埃隆·马斯克在其旗下的社交平台X上言简意赅地发布了上述消息今天凌晨开源版大模型Grok终于来了xAI正式发布3140亿参数混合专家模型Grok-1的基本模型权重和网络架构而3140亿的参数也让Grok-1成为迄今参数量最大的开源LLM官方显示的模型细节包括①基础模... 0
AI应如何“合理”运用他人作品

-训练
 -模型 +人工智能
 +著作权 +数据

03-25 23:00...可能还会对数据予以翻译、标记、汇总与分析——应当如何评价这些行为的法律性质，目前尚存在较大争议。有观点认为，这些行为存在翻译权、改编权、汇编权侵权风险；也有观点认为，其可能落入“应当由著作权人享有的其他权利”，即兜底权利的范畴；还有观点认为，这些行为都是模型的内部活动，并不受《著作权法》控制。擅自使用作品训练AI模型较... 0
谷歌因违规收集训练数据领2.5亿欧元罚单，数据版权问题再引争议

+争议
 +谷歌 +数据
 -训练 +纽约时报

03-24 03:00...谷歌违反了和解协议中的几项条款，包括与相关出版机构谈判、提供透明信息等。监管机构特别提到，谷歌利用媒体平台和新闻机构的数据，用于训练2023年推出的“巴德”，但未告知相关出版机构和监管机构。为此，监管机构表示，“对谷歌的AI服务感到担忧”。因为此次争端，谷歌成为首家因为训练数据而被罚款的AI公司。在AI更新迭代迅速的前... 0
4万亿个晶体管，单机可训练比GPT4大10倍的模型，最大的芯片面世

+新帅 +集训
 +中国队 +中新
 +亮相

03-14 11:30...通过90万个人工智能优化的计算核心，提供每秒125petaflops峰值AI性能（1petaflops是指每秒1,000,000,000,000,000（1万亿）次浮点运算）。WSE-3呈正方形，边长为21.5厘米（面积为46225mm^2），几乎是使用了整个300毫米硅片来制造一个芯片。这么看来，凭借WSE-3，Ce... 0
《纽约时报》指称 ChatGPT 绕过了付费墙，而非“黑客攻击”

+纽约时报 -模型
 -训练 +诉讼
 +法院

03-13 04:00...纽约时报在为其用提示引导ChatGPT吐出记忆（即训练数据，包括100多篇《纽约时报》文章）的策略辩护时指出，ChatGPT用户经常使用该工具生成整篇文章以绕过付费墙。纽约时报辩称，他们目前并不知道有多少篇文章已经被用来训练GPT-3和OpenAI后续的AI模型，也不知道OpenAI使用了哪些特定文章，因为OpenAI... 0
小破本也能炼GPT！300行代码搞定，来自特斯拉前AI总监

+小破本
 +特斯拉 +代码
 -训练 +总监

01-24 05:40...代码并不难，很容易就能满足大家需求——无论是从头开始训练新模型，还是基于预训练进行微调（目前可用的最大模型为1.3B参数的GPT-2）。△一个训练实例展示上手前，需要提前准备好依赖项：pytorch3numpy3pipinstalldatasetsforhuggingfacedatasets3(如果你需要下载和预处理O... 1
海致科技杨娟：知识图谱能够让数字人真正拥有智慧和灵魂

+科技
 -模型 +图谱
 +海致 +智慧

12-17 20:30...熟悉信息技术的朋友们可能知道，知识图谱是人工智能尤其是认知智能的重要技术分支，也是现在第三代混合式人工智能的基石。最近一段时间，ChatGPT（聊天机器人模型）非常火爆，大家也都在探讨能不能把ChatGPT用到元宇宙的构建中来。当然，ChatGPT确实是非常的令人惊艳，但事实上，过往我们在使用Bert（预训练的语言表征... 2

« 1 »