-
05-28 21:30...OpenAI语音AGI研究领导AlexisConneau更直接将自己的社交媒体主页背景,改成了一张电影《Her》中的剧照——这是一部讲述人与AI助手“萨曼莎”相恋的科幻电影。外界甚至为奥特曼编排出了一个与AI助手相爱的浪漫故事。发布会结束后,山姆也顺水推舟地,在自己的X账号上,只发表了一个单词——“Her”。▲不过当看... 0
-
05-20 06:40...GPT-4o在英文文本和代码处理上与此前最新的GPT-4Turbo的性能不相上下,但在非英文文本、视觉和音频理解方面都更为高效。此前,若使用语音模式对话,GPT-3.5的平均延迟为2.8秒,GPT-4则为5.4秒。人类的平均反应时间一般为100毫秒到400毫秒,而GPT-4o最低可达232毫秒,因此后者可以提供几乎无延... 0
-
05-16 20:10...它可以实时对音频、视觉和文本进行接收、推理,并生成文本、音频和图像的任意组合输出。该模型与过往版本比较,省去了将用户的声音转化为文本并处理的步骤,意味着整个流程更加快速。GPT-4o还缩短了模型处理特定数量token所需的时间(在英语文本的情况下,一个token通常等于一个半单词),这也使得该模型比OpenAI此前最佳... 0
-
05-16 20:10...或者它们是不是更像那些早晚会失去吸引力的小把戏。以下是你应该了解的关于如何访问这些新工具、使用它们的目的以及相关费用的信息。OpenAI的GPT-4o它的功能:该模型可以实时与你交谈,响应延迟约320毫秒,OpenAI表示这与人类的自然对话不相上下。你可以让该模型解释你用手机摄像头拍摄的任何东西,它可以帮助你完成写代码... 0
-
05-16 20:10...目前支持超过150个国家的35种语言。谷歌还预告,即将推出下一代Gemma型号Gemma2。Gemma2适用于广泛的AI开发人员,并采用全新的架构,旨在实现突破性的性能和效率。二|AI助手的未来谷歌“智能体”ProjectAstra基于谷歌对于智能体的理解,GoogleDeepMind开发了ProjectAstra,类... 0
-
05-15 06:20...它反应迅速,语调流畅自然,情绪饱满,会跟随着你的情绪兴奋起来,也能根据上下文给出丰富的对话细节,揣摩对话者的情绪。例如,当OpenAI的研发负责人MarkChen上台时,他对着GPT-4o说:“我站在台上有点紧张,该怎么办?”GPT-4o回答:“你太棒了,深呼吸一下吧,记得你可是个专家。”MarkChen随之大声喘气,... 0
-
-
05-15 04:00...GPT-4o能够接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像的任意组合输出,是兼具了“听觉”、“视觉”的多模态模型。对于这项能力,OpenAI做了17个案例展示,其中包括照片转漫画、3D物体合成、海报创作、角色设计等样本。在角色设计案例里,用户向模型输入角色的相关指令,就可以得到一个机器人角色形象。其... 0
-
05-14 03:00...平均为320毫秒,这与人类在谈话中的反应时间,基本一致。此外,GPT-4o在英语文本和代码上的性能与GPT-4Turbo的性能相匹配,在非英语文本上的性能显着提高,同时API的速度也更快,成本降低了50%,速度是GPT-4-turbo的两倍。与现有模型相比,GPT-4o在视觉和音频理解方面尤其出色。2、全能立体,沟通无... 0
-
05-14 02:20...穆拉蒂在OpenAI春季更新发布会上介绍GPT-4o在发布会现场演示中,GPT-4o可以像人工智能助手一样,实现用户与ChatGPT的实时交互,不再是一问一答,也不需要其他按键操作。比如,用户可以说“Hi,ChatGPT”并提出问题,也可以在ChatGPT回答时打断它,它还可以识别用户声音中展现的情感,甚至实时根据用户... 1
-
05-14 02:20...GPT-4o有着更快的反应速度:它可以在232毫秒的时间内响应音频输入,平均为320毫秒,这与人类在谈话中的反应时间,基本一致。此外,GPT-4o在英语文本和代码上的性能与GPT-4Turbo的性能相匹配,在非英语文本上的性能显着提高,同时API的速度也更快,成本降低了50%,速度是GPT-4-turbo的两倍。与现有... 0
-
05-10 04:40...有望与Alphabet旗下的谷歌及资金充足的人工智能搜索Perplexity展开竞争。对此,OpenAI拒绝置评。谷歌年度开发者大会将于下周二开幕,届时该科技巨头预计将推出一系列与人工智能相关的新产品。据报道,OpenAI这款人工智能搜索产品是其旗舰产品ChatGPT的扩展版本,能使ChatGPT直接从网上抽取信息并附... 0
-
04-21 02:30...谷歌Pixel9Pro的尺寸和iPhone15Pro相似,将配备潜望式长焦镜头、TensorG4芯片,提供16GB内存版本(上一代Pro机型配备12GB内存)。同时,谷歌Pixel9Pro有望支持卫星连接。另据此前的爆料显示,谷歌Pixel9系列将包括Pixel9、Pixel9Pro和Pixel9ProXL三款机型,这... 0
-
-
04-20 02:40...(来源/Meta)根据Meta展示的手机操作画面,用户在和朋友计划出行时,可以直接在聊天应用程序内“艾特”@MetaAI,帮助客户寻找旧金山可以看到日落的野餐地点,或者在日本旅游时寻找最佳的观赏樱花地点。Meta首席产品官克里斯·考克斯说:“最终的目标是帮助客户摆脱烦恼,让客户的生活变得更轻松,无论是帮助工作,还是写东... 0
-
04-19 21:10...YouTube在其官网明令禁止“独立”于其之外的应用程序使用其视频内容。而OpenAI的数据并非意外收集的。实际上,OpenAI员工知道这样做会涉足法律灰色地带。OpenAI总裁格雷格·布罗克曼甚至亲自参与了所使用视频的收集。但OpenAI依然认为这是合理的,最终获得了超过100万小时的转录视频。最大的谜团在于,Ope... 0
-
04-17 14:00...转录了100多万条视频并生成GPT-4模型的学习材料,OpenAI创始人之一布罗克曼也参与其中。讽刺的是,谷歌得知OpenAI的行为却并未制止,因为其也在提取YouTube平台内容训练AI模型。《纽约时报》援引消息人士的话表示,这可能侵犯视频版权,因为它们属于创作者。尽管如此,越来越多的科技公司冒着面临诉讼的风险也要“... 0
-
02-26 09:10...研究人员使用Proof-pile和PG19数据集来进行测试。LongRoPE在4k-256k的文本长度上,整体上显示出困惑度下降的趋势,优于基准。LongRoPE在Proof-pile数据集上的表现即使在上下文窗口长度是标准长度16倍的条件下,LongRoPE-2048k模型在256k上下文长度内也超过了最新基线水平。... 1
-
02-21 03:20...在github有一个针对70B大模型在不同平台运行速度的测试。可以发现,无论是每秒生成tokens还是响应速度,Groq都是遥遥领先。天下武功唯快不破,这个说法对大模型也同样适用。就在不久前,互联网上就出现针对chatgpt是不是变慢的讨论。有人说是OpenAI对免费用户进行限制,具体怎么回事硅基君也不清楚,但可以看出... 0
-
02-18 17:40...此次Sora制作的视频在逼真度和艺术感方面有着显著差别:微微卷曲的人物头发,女人脸上的黑痣粉刺,地面积水倒映的霓虹光影,街头商贩摆卖的诸多食品,天空飘落的樱花细雪,细节的精细度几乎已经做到了以假乱真。更令人惊讶的是,Sora视频在构图、色彩、创意和运镜方面,都呈现出明显的电影风格,无论是一镜到底还是多机位都可以无缝切换... 0
-
-
02-18 07:00...整个环境的喜庆氛围仿佛令人身临其境。与此前的AI视频存在明显塑料感不同,此次Sora制作的视频在逼真度和艺术感方面有着显著差别:微微卷曲的人物头发,女人脸上的黑痣粉刺,地面积水倒映的霓虹光影,街头商贩摆卖的诸多食品,天空飘落的樱花细雪,细节的精细度几乎已经做到了以假乱真。更令人惊讶的是,Sora视频在构图、色彩、创意和... 2
-
02-17 02:50...OpenAI发布Sora文生视频模型,可生成最长一分钟视频北京时间2024年2月16日,OpenAI发布文生视频模型Sora,可遵循用户的指示生成长达一分钟的视频,并保持视觉质量。Sora能够生成包含多个角色、特定类型的动作以及主体和背景的准确细节的复杂场景。在OpenAI官网上可看到多个由Sora模型生成的视频案例,... 0
-
02-16 14:50...与GPT-4的最佳版本(GPT-4Turbo)相当。目前,开发者能向Gemini1.5Pro最多提交100万个tokens,这相当于大约1小时的视频、11小时的音频或700000字的文本。毫无疑问这是一个巨大的飞跃,使得我们可以做目前其他模型无法做到的事情。在谷歌展示的一段演示视频中,研究人员使用百万tokens版本向... 1
-
02-12 07:10...顾名思义,预测式AI会根据现有数据进行趋势的预测或提供见解,而不会生成全新的内容。相比之下,生成式AI会利用机器学习,从训练数据中学到思考的模式,以此创造具有原创性的输出。生成式AI和Deepfake研究专家HenryAdjer指出:我们仍处于这场生成式革命的初期阶段;未来,合成介质和内容将在日常生活中无处不在,并且实... 0
-
-
-
本页Url:
-
2024-05-29-12:13 GMT . 添加到桌面浏览更方便.
-