ycUS1DclBQmAGNFJKy
2025-07-01 19:46:40
281
http://127.0.0.1/
2025-07-04 03:37:31
sales0001@rehomi.store
今日资讯37条,共计7018字"DeepMind Gemini2.5Pro:长上下文AI新篇章"谷歌 DeepMind 推出的Gemini2.5Pro模型,因其能处理百万级长上下文而备受关注,这让它在大语言模型中脱颖而出,尤其在编程和信息检索领域表现出色。不过,这个模型成本高,质量还有提升空间。DeepMind的研究科学家表示,用户提供的上下文信息能提升模型的个性化和准确性,而RAG技术将与长上下
AI日报,PerMAXity,RecGPT,Qwen-TTS,Cursor Web,AI动画库
281
AI日报:自动化财务分析,投资决策新利器
3
[{"attributes":{"background":"#ffffff","color":"#595959"},"insert":"今日资讯37条,共计7018字"},{"attributes":{"blockquote":true},"insert":"\n"},{"insert":"\n\"DeepMind Gemini2.5Pro:长上下文AI新篇章\"\n谷歌 DeepMind 推出的Gemini2.5Pro模型,因其能处理百万级长上下文而备受关注,这让它在大语言模型中脱颖而出,尤其在编程和信息检索领域表现出色。不过,这个模型成本高,质量还有提升空间。DeepMind的研究科学家表示,用户提供的上下文信息能提升模型的个性化和准确性,而RAG技术将与长上下文结合,进一步提高性能。预计未来,长上下文处理能力将更强,AI技术将更智能、个性化。总之,Gemini2.5Pro预示着AI技术的新阶段,有望改变信息交互方式。\n\n淘天集团推RecGPT,个性化推荐升级显著\n淘宝在“硬核少年技术节4.0”上推出了自主研发的推荐大模型RecGPT,让“猜你喜欢”功能大升级。这个新模型通过分析用户历史行为和商品信息,提供更个性化的推荐,让用户购物体验更佳。数据显示,使用RecGPT后,用户点击量和加购行为显著增加。系统还能根据用户需求预测推荐商品,比如宝宝满周岁时推荐学步车等。此外,推荐理由也变得个性化,提升了用户互动。这项技术不仅提升了电商推荐效果,还为行业技术发展开辟了新方向。\n\nPerMAXity:自动化财务分析,投资决策新利器\nPerplexity新推出的PerMAXity功能,能让用户自动获取投资组合的财务报告,无需手动分析。这个功能结合了实时市场数据和财务报表,生成详细的分析报告,大大节省了时间,提供了更精准的市场信息。它不仅适合个人投资者,还能帮助财务顾问、基金经理和企业主。PerMAXity的出现,让AI在金融领域的应用更深入,有望让投资分析变得更加普及和高效。\n\nMeta成立“超级智能实验室”,聚焦AI研发。\nMeta公司要组建一个新团队,名叫“超级智能实验室”,专门用来研发更高级的“超级智能”人工智能技术。这个消息是彭博社从Meta的内部文件里挖出来的。Meta的老大马克·扎克伯格想要通过这次调整,让公司更聚焦在人工智能上。他们请来了前Scale AI的老板亚历山大·王来当首席人工智能官,前GitHub的老板纳特·弗里德曼来管产品和研究。为了加快进度,Meta还砸了143亿美元投资AI,挖来了包括谷歌和Anthropic的11名AI大牛。这一系列动作显示了Meta要在人工智能领域大干一场的决心。\n\nNoteGen:全平台Markdown笔记,AI赋能知识管理\nNoteGen是一款跨平台的AI笔记软件,支持Windows、MacOS、Linux、iOS和Android,提供永久免费的多设备数据同步。它使用原生Markdown格式,让笔记简洁高效,并支持接入ChatGPT等第三方AI模型,提升创作效率。NoteGen还特别设计了记录和写作两种模式,方便用户从捕捉灵感到整理笔记。这款软件的发布预示着笔记工具智能化时代的到来,有望改变知识管理的未来。\n\nAI诊断准确率高成本降七成\n微软新推出的AI系统MAI-DxO,能在诊断复杂医疗病例时比经验丰富的医生准确率高四倍,同时还能大幅降低治疗成本近70%。这个系统通过模拟医生逐步诊断的过程,动态地获取信息来提高诊断准确性。不过,这个测试是基于复杂病例的,可能不能完全代表日常医疗情况,而且成本计算也不够精确。简单来说,MAI-DxO在处理复杂病例时表现出色,但还有一些限制和挑战需要解决。\n\nRecGPT上线,淘宝推荐更精准智能\n淘宝昨日推出了一款名为RecGPT的百亿参数推荐大模型,这个新模型能让“猜你喜欢”信息流更精准、个性化。测试显示,使用RecGPT后,用户点击量和加购次数显著增长。这个模型基于大数据和深度学习,能分析用户多年消费行为,提供更智能的购物建议。淘宝这次升级,不仅提升了用户体验,还巩固了其在电商AI领域的领先地位。\n\nTEN VAD开源,帧级语音检测助AI对话更自然\nTEN Agent团队开源了一款名为TEN VAD的企业级实时语音检测器,它能够精确识别语音并过滤噪音,性能优于其他常用检测器。这款轻量级、低延迟的模型适用于多种硬件和操作系统,支持Python和WebAssembly,方便开发者部署。TEN VAD与TEN Turn Detection配合,能打造出接近人类交互水平的AI语音助手。开源后,TEN VAD在GitHub上获得了广泛关注,有望推动语音交互技术的发展。简单来说,TEN VAD让语音识别更准确、更自然,对开发智能语音应用有很大帮助。\n\nAI助力抗体设计,研发周期缩短至两周\nChai Discovery公司最近推出了一款名为Chai-2的AI模型,这项新技术能在药物研发中实现零样本抗体设计,成功率高达16%-20%,比传统方法快了百倍以上,研发周期也从数月或数年缩短到两周。Chai-2不需要依赖现有的抗体模板或大量实验筛选,只需抗原信息就能设计出抗体。这项技术不仅提高了效率,还降低了成本,有望在治疗癌症、自身免疫疾病等领域带来重大突破。\n\nTEN VAD与TEN Turn Detection开源,推动语音AI代理发展\nTEN Agent团队推出了两款开源语音技术:TEN Voice Activity Detection(VAD)和TEN Turn Detection,这将帮助开发更智能的语音助手。TEN VAD特别适合企业使用,它能在极短的时间内准确检测到语音活动,比其他常用技术更高效。这项技术不仅计算量小,兼容多种操作系统,还能在Web上运行,对推动语音交互技术发展有着重要意义。\n\nQwen-TTS:多方言AI语音,自然真实感强\n阿里巴巴的通义团队推出了一款名为Qwen-TTS的文本转语音模型,这款模型因为声音超真实和能支持多种方言而受到关注。它不仅可以让机器发出的声音几乎和真人一样自然,还能说北京话、上海话、四川话等方言,以及中英双语。这项技术对于教育、娱乐和智能客服等领域都很有用,因为它能提供更自然的语音交互体验。Qwen-TTS还能根据文本内容调整语调和情感,让声音听起来更有感情。这项新技术的出现可能会让语音合成技术更普及,未来,支持更多方言和个性化音色可能会成为这个领域的重要发展方向。\n\nAI编码工具Cursor Web版发布,重塑编程体验\nCursor Web版和移动版在2025年6月30日上线,让开发者能在浏览器和手机上用AI编码,不仅方便了编程,还提高了协作效率。这个新版本保留了桌面版的亮点功能,还增加了与Slack等工具的集成,让远程工作更顺畅。虽然在一些网络环境下性能还需改进,但这个工具已经受到开发者的好评,有望改变AI编码工具的使用习惯,对中小团队和独立开发者特别有帮助。\n\nChai-2抗体设计突破,高效加速药物研发\nChai Discovery在2025年推出了一款名为Chai-2的AI模型,这项技术让抗体设计变得更快更精准。Chai-2能从无到有设计抗体,实验成功率高达16-20%,比传统方法强得多。它不需要模板或大量筛选,两周内就能设计并验证出高亲和力的抗体。虽然还没完全开源,但已经有很多人讨论它,认为它可能加快癌症和传染病药物的研发。这项技术未来还有望让药物开发更便宜,对应对新疾病和个性化治疗特别有用。\n\nAI动画库ManimML,让机器学习可视化更直观\n人工智能的发展让复杂的机器学习模型变得流行,但如何让大众理解这些复杂概念是个挑战。ManimML这个Python开源动画库就能做到这一点,它通过动画和可视化让神经网络架构变得简单易懂。ManimML让机器学习从业者不需要专业知识就能制作出专业级的动画,只需几行代码就能展示神经网络的工作过程。自从推出以来,它在学术界和开发者中很受欢迎,已经有超过1300个GitHub星标,下载量超过2.3万次。这个工具不仅有助于学术交流,还能让AI教育更普及。简单来说,ManimML让复杂的机器学习知识变得生动形象,更容易被大家理解和学习。\n\n字节发布XVerse,多主体图像生成技术革新\n字节跳动推出了一项新图像合成技术,名叫XVerse,它能让用户精确控制多个图像中的个体,提高了图像生成的个性化和复杂度。XVerse的关键技术DiT,能调整每个主体的身份和特征,让图像合成更灵活。用户需要设置一个Python环境,安装依赖,下载模型,就能通过简单的文字描述生成逼真图像。这个技术界面友好,操作简单,未来可能会在数字创作、广告和艺术领域大放异彩。更多信息可以在他们的GitHub页面找到。\n\nCursor移动版发布,AI编程随时随地\nCursor,这款程序员们喜爱的AI编程工具,现在有了重大更新!它不仅支持Web版,还能在手机上使用了,让编程不再局限于桌面,变得更加灵活和高效。手机版Cursor能让你随时随地编程,支持多任务处理、项目选择、任务管理,还能和GitHub深度集成。虽然功能比桌面版精简,但已经很适合处理轻量级任务和远程协作了。这一更新不仅提升了用户体验,也可能引发其他编程工具的移动化竞争,为编程工作方式带来革新。\n\n百度开源文心大模型,性能超越GPT4.5\n百度推出了新的文心大模型4.5系列,共有10款模型,包括大型的混合专家模型和较小参数的稠密型模型。这些模型不仅开源免费,还提供了预训练权重和代码,方便开发者使用。英特尔也展示了技术支持,用其OpenVINO工具套件快速适配这些模型,并在酷睿Ultra平台上部署。百度和英特尔的合作让开发者能通过OpenVINO优化飞桨模型,提升部署效果。文心大模型4.5性能卓越,成本仅为GPT4.5的1%,为开发者提供了强大的AI工具。这次合作预示着AI技术应用的广阔前景。\n\n谷歌Gemini教育版助力教学效率提升\n谷歌在ISTE年会上推出“Gemini for Education”计划,为教师和学生提供免费的人工智能工具,包括Gemini2.5Pro模型,帮助提升教学效率。新功能“Gemini in the Classroom”提供30多项新功能,如自动生成词汇表和制作教育视频。部分AI功能将作为付费服务,如Veo3音效制作和“Gemini in Forms”测验生成。年满18岁的学生可用“Gemini Canvas”生成个性化测验题。此外,NotebookLM也将开放给所有年级,配合严格的内容政策。这些新措施将助力教育科技发展,让教师和学生更便捷地使用先进工具。\n\n甲骨文云交易将增300亿年收入\n甲骨文公司公布了一笔大交易,这交易能让他们每年多收入超过300亿美元,消息一出来,公司股票价格就涨了4%,还创下了历史新高。这个大交易将从2028年开始给公司挣钱,但短期内不会影响公司的业绩预期。今年甲骨文的股票已经涨了33%以上,因为他们不仅云计算业务做得好,还在人工智能领域不断有大动作。\n\n特斯拉无人驾驶技术突破,工厂到家的创新交付\n特斯拉展示了全球首个全程自动驾驶的汽车交付过程,车辆自主行驶17英里,成功通过了停车场、高速公路和城市道路,最终准确到达新车主家。这个技术突破不仅展示了特斯拉AI算法的强大能力,也预示着未来汽车行业将迎来智能化变革,自动驾驶技术可能会改变我们买车的体验和出行方式。\n\n特斯拉Model Y完成首次无人自动驾驶交付\n特斯拉成功用自动驾驶技术将一辆Model Y SUV从工厂开到新车主家,全程15英里,无人干预。CEO马斯克称之为“自动驾驶交付”首秀。这辆车用的是和奥斯汀自动驾驶出租车一样的软件,但交付后软件降级,需要驾驶员随时准备接管。这次交付正值特斯拉发布季度数据,尽管公司面临销量下滑和形象受损的挑战,但这次自动驾驶交付的展示让股价一度飙升。不过,也有人质疑特斯拉的自动驾驶技术是否真的成熟可靠,毕竟一次成功不代表次次都能成功。\n\nOpenAI否认谷歌芯片合作,自研芯片应对计算需求\n最近有媒体报道说OpenAI要大规模用谷歌的自研芯片,但OpenAI出来澄清了,说他们现在只是初步测试这些芯片,并没有打算大规模使用。OpenAI现在主要用的是英伟达和AMD的芯片,同时他们也在开发自己的芯片,今年就能定型了。虽然他们和谷歌云有合作,但主要的计算能力还是靠CoreWeave提供的GPU服务器。总之,OpenAI在芯片使用上很灵活,既有合作也有自主研发。\n\n苹果AI战略遇挫,人才流失加剧\n苹果公司最近遇到了麻烦,他们的一位非常重要的AI专家汤姆・冈特离职了,这让公司内部人心惶惶。这位专家在AI领域的知识很难找到替代者,而竞争对手正用高薪挖人。苹果的AI战略出现了分歧,导致团队流失,他们现在得努力留住关键员工,否则在AI领域的竞争力会下降。更糟糕的是,负责一个重要机器学习框架的团队几乎全走了,这对苹果来说是个大打击。公司内部还在争论是否要把一些AI功能外包给其他公司,这反映出他们对自家AI技术不太自信。苹果得赶紧想办法激励团队,弄清楚以后怎么走,不然在AI这个领域可能会落后。\n\nMeta转向开源AI,寻求外部支持\nMeta Platforms 正在考虑放弃自家研发的 Llama AI 模型,转用竞争对手的技术,因为自家产品未获市场认可。为了追赶进度,Meta 投资了 143 亿美元于 AI 公司 Scale AI,并设立新团队,还提供高达 1 亿美元的奖金吸引人才。尽管面临挑战,华尔街分析师仍对 Meta 保持乐观,认为其股票值得买入。Meta 的转型之路充满挑战,其未来在 AI 领域的表现还需时日来验证。\n\n苹果Siri将迎AI技术革新\n苹果公司正考虑在新版Siri中使用OpenAI和Anthropic的人工智能技术,这标志着他们可能首次在AI领域寻求外部帮助,改变以往只依赖自研技术的策略。苹果高管迈克・罗克韦尔认为,引入第三方技术是突破现有局限的有效方法。同时,苹果也在考虑收购AI搜索公司Perplexity,并与多家AI公司进行沟通,以在智能语音助手市场夺回优势。这些动作显示了苹果对生成式AI发展的重视,以及在全球科技竞争中寻求新定位的努力。\n\nQwen-TTS升级,方言语音更自然\nQwen-TTS语音合成模型最近更新了,现在能模仿北京话、上海话和四川话三种方言,让语音听起来更自然、有感情。这个模型训练了300万小时的语音数据,效果接近真人说话。用户可以选择不同的音色,比如为方言设计的Dylan、Jada和Sunny,来合成语音。开发团队计划未来加入更多语言和风格,让更多人能用上这个技术。\n\n\n\"英国20亿英镑投资AI,电网升级应对需求激增\"\n英国政府砸下20亿英镑,推出“人工智能机遇行动计划”,目标是让英国在AI领域领先。但AI快速发展,电力需求也跟着猛增。政府得确保未来五年计算能力大增,电网能跟上需求,否则AI发展可能受限。为此,政府召集了AI能源委员会,包括微软、亚马逊、谷歌等大腕,一起预测能源需求,确保电网准备充分。政府还计划设立“人工智能增长区”,吸引投资,创造就业,但也要小心别让居民生活受影响,比如房租上涨。政府打算提供福利和培训,帮助居民适应变化。\n\n欧洲首台百万兆级超算助气候研究\n德国于利希超级计算中心推出了欧洲第一台超强的百万兆次级超级计算机,名叫JUPITER。这个大家伙有5900个加速节点和24000颗超级芯片,能帮忙科学家们处理复杂的气候和天气预报计算。它还能模拟地球系统,帮助科学家更好地理解自然现象。JUPITER还特别节能,用鲁尔河的水来冷却,既环保又高效。这台计算机让欧洲在超级计算领域迈出了大步,给科学研究带来了新机会。\n\n知乎直答升级,AI问答更沉浸\n知乎推出了升级版的AI搜索工具“知乎直答”,这次升级让知识库功能更强大,用户可以更方便地订阅、分享内容,还能享受沉浸式的AI问答。新功能包括边看边问、精准提问等,让获取信息更高效,也能和知乎的专业内容无缝互动。知乎直答不断进步,现在不仅能溯源答主的真实创作,还提升了AI的思维深度。知乎的目标是通过高质量内容、社区专家网络和AI能力,打造AI时代的竞争优势。这次升级意味着知乎在AI和社区融合方面又前进了一步,让用户获取知识更方便。\n\nOmniGen2:图文生成新高度,多模态创新突破\n北京人工智能研究院新推出的OmniGen2系统,是个会生成图片和编辑图片的智能工具。它比之前的版本更厉害,因为文本和图片处理各有一套独立的解码器,这让它在生成文字和图片时都更出色。OmniGen2能搞定的艺术风格多样,但生成的图片清晰度还需提高。它还能自己检查并改进生成的图片,这在其他模型里比较少见。在多个测试里,OmniGen2的成绩都比其他开源模型好,尤其是在图像编辑上。不过,它对中文的处理还不如英文,处理复杂形态和模糊提示时也有难度。研究团队打算把这套系统和相关数据都放到Hugging Face平台上,让大家都能用。\n\n谷歌Gemini“定时任务”提升生产力\n谷歌的Gemini智能助手新推出了“Scheduled Actions”功能,这是一个定时任务功能,用户可以通过简单的自然语言提示设定未来或定期任务,比如设定每天早上接收股市分析报告或AI资讯。这个功能操作简单,能和谷歌的Gmail、日历等工具深度整合,但目前只对部分订阅用户开放。虽然它为用户带来了便利,但也需要注意隐私和可靠性问题。谷歌的这个新功能被视为AI助手向更主动的角色转变的重要一步。\n\n百度开源文心大模型,多模态AI技术领先\n百度最近开源了文心大模型4.5系列,推出了十款不同规模的模型,包括大型的47B和3B模型,以及小型的0.3B模型。这些模型不仅开放了预训练权重,还提供了推理代码,让开发者能在多个平台上使用。百度此举是国内科技巨头中的一大步,显示了其在人工智能领域的雄心。这些模型特别适合内存有限的设备,性能上也很有竞争力,已经在多个测试中超越了GPT-4o。百度的开源动作给行业带来了新标准,让开发者能更自由地研究和应用这些模型,推动AI技术的发展。\n\nAI百宝箱内测结束,小米AI生态持续进化\n小米的“AI百宝箱”项目内测结束了,计划在2025年7月暂停服务。这个项目是小米用来探索AI技术,给用户带来新功能的。虽然具体功能没完全公开,但听起来像是集成了很多AI工具的集合。现在内测完了,小米会整理收集到的数据和反馈,可能为以后的发展做规划。小米一直在AI领域努力,希望通过各种产品和服务,打造一个全面的AI生态系统。\n\n豆包新功能上线,助高效处理复杂任务\n豆包APP推出了新功能「深入研究」,它能帮助用户快速整合大量信息,生成详细报告或可视化网页,适合规划旅行、做决策、解读政策等。更新APP后,输入指令就能得到个性化报告,还能把报告转为播客方便收听。\n\n\n文心大模型4.5开源,多模态AI技术可用\n百度推出了最新的文心大模型4.5,这个系列有十种不同的模型,全都开源了!这些模型有各种大小,最大的有47亿个参数,小的也有3亿个。它们用飞桨框架训练,效率很高,在处理文本和图像的任务上达到了顶尖水平。开发者现在可以通过ERNIEKit和FastDeploy这些工具,轻松地训练和部署模型。百度还提供了详细的指南和API服务,让大家都更容易使用这些先进的技术。总之,现在无论是研究还是开发,都能更方便地接触到这些AI新成果了。\n\n飞利浦发布AI耳机,多语言翻译助沟通\n飞利浦在西安的新品发布会上推出了三款创新产品,包括为年轻人设计的磁吸充电宝、商务精英的AI耳机和家用KTV音箱。特别是8号Pro AI耳机,支持17种语言互译和27种方言识别,内置专业术语库,还有55dB降噪功能,方便商务人士和年轻人在嘈杂环境中使用。这些产品展示了飞利浦在消费电子领域的领先地位,并满足了市场对智能化、便携产品的需求。\n\nGPT-5多模态革新,AI交互更自然\n科技界最近热议OpenAI即将推出的GPT-5,这个新AI模型预计7月上线,不仅能理解文字,还能处理语音、图像、代码和视频,让与AI的互动更自然。GPT-5将带来AI技术的飞跃,它具备强大的推理能力和视频生成技能,还能编写大量代码。这个新模型旨在减少AI生成内容时的错误,同时保持聊天流畅,为开发者带来便利,提升各行业生产力,让AI应用更广泛。\n\n\n"},{"attributes":{"background":"#ffffff","color":"#595959"},"insert":"该AI资讯由智图AI 项目组提供:"},{"attributes":{"background":"#ffffff","color":"#0066cc","link":"https://rehomi.com/tools/zhituAI","underline":true},"insert":"https://rehomi.com/tools/zhituAI"},{"insert":"\n"}]
https://aigc-files.bigmodel.cn/api/cogview/20250627194604549fd02963004c37_0.png
0
["AI日报","PerMAXity","RecGPT","Qwen-TTS","Cursor Web","AI动画库"]
0
1
6