ChatGPT这么会聊天，还要朋友干什么,谷歌,文本

ChatGPT这么会聊天，还要朋友干什么

 -谷歌
 +发布会 +助手
 -文本 +语音

05-28 21:30...OpenAI语音AGI研究领导AlexisConneau更直接将自己的社交媒体主页背景，改成了一张电影《Her》中的剧照——这是一部讲述人与AI助手“萨曼莎”相恋的科幻电影。外界甚至为奥特曼编排出了一个与AI助手相爱的浪漫故事。发布会结束后，山姆也顺水推舟地，在自己的X账号上，只发表了一个单词——“Her”。▲不过当看... 0
AI可以“做个人了”，怎么办

+语音
 -谷歌 +模型
 +发布会 -文本

05-20 06:40...GPT-4o在英文文本和代码处理上与此前最新的GPT-4Turbo的性能不相上下，但在非英文文本、视觉和音频理解方面都更为高效。此前，若使用语音模式对话，GPT-3.5的平均延迟为2.8秒，GPT-4则为5.4秒。人类的平均反应时间一般为100毫秒到400毫秒，而GPT-4o最低可达232毫秒，因此后者可以提供几乎无延... 0
谷歌、OpenAI产品对决一大看点：AI助手能否成为杀手级应用？

-谷歌
 +人工智能 +助手
 +模型 -文本

05-16 20:10...它可以实时对音频、视觉和文本进行接收、推理，并生成文本、音频和图像的任意组合输出。该模型与过往版本比较，省去了将用户的声音转化为文本并处理的步骤，意味着整个流程更加快速。GPT-4o还缩短了模型处理特定数量token所需的时间（在英语文本的情况下，一个token通常等于一个半单词），这也使得该模型比OpenAI此前最佳... 0
OpenAI GPT

+电信
 +网络 +德国
 -谷歌 +人工智能

05-16 20:10...或者它们是不是更像那些早晚会失去吸引力的小把戏。以下是你应该了解的关于如何访问这些新工具、使用它们的目的以及相关费用的信息。OpenAI的GPT-4o它的功能：该模型可以实时与你交谈，响应延迟约320毫秒，OpenAI表示这与人类的自然对话不相上下。你可以让该模型解释你用手机摄像头拍摄的任何东西，它可以帮助你完成写代码... 0
谷歌回击OpenAI：发布AI全家桶，搜索大变身，Project Astra剑指GPT

-谷歌 +模型
 +照片 +大变身
 +图像

05-16 20:10...目前支持超过150个国家的35种语言。谷歌还预告，即将推出下一代Gemma型号Gemma2。Gemma2适用于广泛的AI开发人员，并采用全新的架构，旨在实现突破性的性能和效率。二｜AI助手的未来谷歌“智能体”ProjectAstra基于谷歌对于智能体的理解，GoogleDeepMind开发了ProjectAstra，类... 0
ChatGPT这么会聊天，还要朋友干什么

 -谷歌 +助手
 -文本 +发布会
 +语音

05-15 06:20...它反应迅速，语调流畅自然，情绪饱满，会跟随着你的情绪兴奋起来，也能根据上下文给出丰富的对话细节，揣摩对话者的情绪。例如，当OpenAI的研发负责人MarkChen上台时，他对着GPT-4o说：“我站在台上有点紧张，该怎么办？”GPT-4o回答：“你太棒了，深呼吸一下吧，记得你可是个专家。”MarkChen随之大声喘气，... 0
谷歌再遭OpenAI截胡！多模态AI概念股暴涨，苹果市值一夜激增3500多亿元

+小海 +执行官
 +任命 +首席
 +上海

05-15 04:00...GPT-4o能够接受文本、音频和图像的任意组合作为输入，并生成文本、音频和图像的任意组合输出，是兼具了“听觉”、“视觉”的多模态模型。对于这项能力，OpenAI做了17个案例展示，其中包括照片转漫画、3D物体合成、海报创作、角色设计等样本。在角色设计案例里，用户向模型输入角色的相关指令，就可以得到一个机器人角色形象。其... 0
深夜重磅炸弹！OpenAI再压谷歌一头，最强模型GPT

-文本
 +模型 -谷歌
 +对话 +语音

05-14 03:00...平均为320毫秒，这与人类在谈话中的反应时间，基本一致。此外，GPT-4o在英语文本和代码上的性能与GPT-4Turbo的性能相匹配，在非英语文本上的性能显着提高，同时API的速度也更快，成本降低了50%，速度是GPT-4-turbo的两倍。与现有模型相比，GPT-4o在视觉和音频理解方面尤其出色。2、全能立体，沟通无... 0
电影中的人工智能来了！OpenAI发布全能大模型：文图音任意组合输出，可实现人类级别响应

+重磅 -谷歌
 +炸弹 +模型
 -文本

05-14 02:20...穆拉蒂在OpenAI春季更新发布会上介绍GPT-4o在发布会现场演示中，GPT-4o可以像人工智能助手一样，实现用户与ChatGPT的实时交互，不再是一问一答，也不需要其他按键操作。比如，用户可以说“Hi，ChatGPT”并提出问题，也可以在ChatGPT回答时打断它，它还可以识别用户声音中展现的情感，甚至实时根据用户... 1
深夜重磅炸弹！OpenAI再压谷歌一头，最强模型GPT

+曹路
 +难治 +破题
 +顽疾 +电动

05-14 02:20...GPT-4o有着更快的反应速度：它可以在232毫秒的时间内响应音频输入，平均为320毫秒，这与人类在谈话中的反应时间，基本一致。此外，GPT-4o在英语文本和代码上的性能与GPT-4Turbo的性能相匹配，在非英语文本上的性能显着提高，同时API的速度也更快，成本降低了50%，速度是GPT-4-turbo的两倍。与现有... 0
消息称OpenAI计划下周一公布AI搜索产品

+人工智能
 -谷歌 +计划
 +搜索引擎 -文本

05-10 04:40...有望与Alphabet旗下的谷歌及资金充足的人工智能搜索Perplexity展开竞争。对此，OpenAI拒绝置评。谷歌年度开发者大会将于下周二开幕，届时该科技巨头预计将推出一系列与人工智能相关的新产品。据报道，OpenAI这款人工智能搜索产品是其旗舰产品ChatGPT的扩展版本，能使ChatGPT直接从网上抽取信息并附... 0
或10月发布，谷歌Pixel 9 Pro真机图曝光

-谷歌
 +爆料 +真机
 +机型 +功能

04-21 02:30...谷歌Pixel9Pro的尺寸和iPhone15Pro相似，将配备潜望式长焦镜头、TensorG4芯片，提供16GB内存版本（上一代Pro机型配备12GB内存）。同时，谷歌Pixel9Pro有望支持卫星连接。另据此前的爆料显示，谷歌Pixel9系列将包括Pixel9、Pixel9Pro和Pixel9ProXL三款机型，这... 0
Meta重大发布！挑战OpenAI

+概念车 +亮相
 +家族 +北京
 +模型

04-20 02:40...（来源/Meta）根据Meta展示的手机操作画面，用户在和朋友计划出行时，可以直接在聊天应用程序内“艾特”@MetaAI，帮助客户寻找旧金山可以看到日落的野餐地点，或者在日本旅游时寻找最佳的观赏樱花地点。Meta首席产品官克里斯·考克斯说：“最终的目标是帮助客户摆脱烦恼，让客户的生活变得更轻松，无论是帮助工作，还是写东... 0
繁荣背后存隐忧，美AI巨头被控秘密“侵吞”数据

 +数据 +训练
 -谷歌 +巨头
 +被控

04-19 21:10...YouTube在其官网明令禁止“独立”于其之外的应用程序使用其视频内容。而OpenAI的数据并非意外收集的。实际上，OpenAI员工知道这样做会涉足法律灰色地带。OpenAI总裁格雷格·布罗克曼甚至亲自参与了所使用视频的收集。但OpenAI依然认为这是合理的，最终获得了超过100万小时的转录视频。最大的谜团在于，Ope... 0
为训练AI，OpenAI等科技巨头花式淘数据

+数据
 +花式 +模型
 +训练 +纽约时报

04-17 14:00...转录了100多万条视频并生成GPT-4模型的学习材料，OpenAI创始人之一布罗克曼也参与其中。讽刺的是，谷歌得知OpenAI的行为却并未制止，因为其也在提取YouTube平台内容训练AI模型。《纽约时报》援引消息人士的话表示，这可能侵犯视频版权，因为它们属于创作者。尽管如此，越来越多的科技公司冒着面临诉讼的风险也要“... 0
200万上下文窗口创飞Gemini 1.5！微软来砸谷歌场子了

 +窗口
 +模型 +长度
 -文本 +场子

02-26 09:10...研究人员使用Proof-pile和PG19数据集来进行测试。LongRoPE在4k-256k的文本长度上，整体上显示出困惑度下降的趋势，优于基准。LongRoPE在Proof-pile数据集上的表现即使在上下文窗口长度是标准长度16倍的条件下，LongRoPE-2048k模型在256k上下文长度内也超过了最新基线水平。... 1
有没有嫌弃GPT内容生成太慢的？总算有公司在解决这问题了

+模型
 +速度 -谷歌
 +内存 +芯片

02-21 03:20...在github有一个针对70B大模型在不同平台运行速度的测试。可以发现，无论是每秒生成tokens还是响应速度，Groq都是遥遥领先。天下武功唯快不破，这个说法对大模型也同样适用。就在不久前，互联网上就出现针对chatgpt是不是变慢的讨论。有人说是OpenAI对免费用户进行限制，具体怎么回事硅基君也不清楚，但可以看出... 0
OpenAI的Sora会砸掉谁的饭碗？左右好莱坞劳资谈判

-文本
 +创业 +奥特曼
 +模型 +好莱坞

02-18 17:40...此次Sora制作的视频在逼真度和艺术感方面有着显著差别：微微卷曲的人物头发，女人脸上的黑痣粉刺，地面积水倒映的霓虹光影，街头商贩摆卖的诸多食品，天空飘落的樱花细雪，细节的精细度几乎已经做到了以假乱真。更令人惊讶的是，Sora视频在构图、色彩、创意和运镜方面，都呈现出明显的电影风格，无论是一镜到底还是多机位都可以无缝切换... 0
OpenAI的Sora会砸掉谁的饭碗？

+返程 +行囊
 +锦绣 +重整
 -文本

02-18 07:00...整个环境的喜庆氛围仿佛令人身临其境。与此前的AI视频存在明显塑料感不同，此次Sora制作的视频在逼真度和艺术感方面有着显著差别：微微卷曲的人物头发，女人脸上的黑痣粉刺，地面积水倒映的霓虹光影，街头商贩摆卖的诸多食品，天空飘落的樱花细雪，细节的精细度几乎已经做到了以假乱真。更令人惊讶的是，Sora视频在构图、色彩、创意和... 2
浙商证券：OpenAI&谷歌相继发力有望引领多模态大模型浪潮

+模型
 +证券 +模态
 -谷歌 -文本

02-17 02:50...OpenAI发布Sora文生视频模型，可生成最长一分钟视频北京时间2024年2月16日，OpenAI发布文生视频模型Sora，可遵循用户的指示生成长达一分钟的视频，并保持视觉质量。Sora能够生成包含多个角色、特定类型的动作以及主体和背景的准确细节的复杂场景。在OpenAI官网上可看到多个由Sora模型生成的视频案例，... 0
谷歌发布Gemini 1.5，能自动识别视频中的幽默梗，目前仅面向部分用户

 -谷歌 +模型
 +人工智能 +自动识别
 +版本

02-16 14:50...与GPT-4的最佳版本（GPT-4Turbo）相当。目前，开发者能向Gemini1.5Pro最多提交100万个tokens，这相当于大约1小时的视频、11小时的音频或700000字的文本。毫无疑问这是一个巨大的飞跃，使得我们可以做目前其他模型无法做到的事情。在谷歌展示的一段演示视频中，研究人员使用百万tokens版本向... 1
生成式AI大爆发后 2024年人工智能行业有哪些新趋势？

+模态
 +模型 +人工智能
 +宣传片 +个性化

02-12 07:10...顾名思义，预测式AI会根据现有数据进行趋势的预测或提供见解，而不会生成全新的内容。相比之下，生成式AI会利用机器学习，从训练数据中学到思考的模式，以此创造具有原创性的输出。生成式AI和Deepfake研究专家HenryAdjer指出：我们仍处于这场生成式革命的初期阶段；未来，合成介质和内容将在日常生活中无处不在，并且实... 0

« 1 2 »