字节跳动 X-Portrait2 技术:引领 AI 视频驱动的新时代

字节跳动智能创作团队提出的 X-Portrait2 单图视频驱动技术,实现了仅凭一张静态照片和一段驱动视频生成高质量、电影级视频的突破。该技术不仅能保留原图身份...

60 秒生成 5 秒 AI 视频,字节自研视频生成模型 Seaweed 开放使用

字节跳动旗下的AI内容平台即梦AI宣布,由字节跳动自研的视频生成模型Seaweed面向平台用户正式开放。用户登录后,在“视频生成”功能下,视频模型选择“视频S2.0”...

Meta 开源小语言 AI 模型 MobileLLM 家族:适用智能手机、提供 125M-1B 版本

Meta 于上周发布新闻稿,宣布正式开源可在智能手机上运行的小语言模型 MobileLLM 家族,并同时为系列模型新增 600M、1B 和 1.5B 三种不同参数版本。MobileLLM...

告别‘默片’:智谱发布新清影,可生成 10 秒 4K60 帧 / 自带音效视频

智谱技术团队今天发布并开源最新版本的视频模型 CogVideoX v1.5,相比于原有模型,CogVideoX v1.5 将包含 5/10 秒、768P、16 帧的视频生成能力,I2V 模型支持...

谷歌 Gemini 2.0 AI 模型现踪迹,响应速度更快

谷歌公司正酝酿 Gemini 2.0 版本更新。根据最新曝光的截图,Advanced 用户在 AI 模型选择界面中,可以看到 Gemini 2.0,初步测试结果显示,相比较 Gemini 1.5...

AI 机器人画作首登苏富比拍卖,成交价 108 万美元

全球首次:AI 机器人画作首登苏富比拍卖,成交价 108 万美元,帕鲁AI 11 月 8 日消息,英国卫报今天(11 月 8 日)发布博文,报道称由类人机器人创作的艺术品...

谷歌 DeepMind 研究再登 Nature 封面,隐形水印让 AI 无所遁形

谷歌 DeepMind 团队最近在 Nature 期刊上发表了一项研究,开发了一种名为 SynthID-Text 的水印方案,可以应用于大型语言模型(LLM),以跟踪 AI 生成的文本内...

CogVideoX + CogSound: Enhancing Silent Videos with Immersive Sound Effects

早在2021年,我们便开始了大规模训练视频生成模型的探索,先后推出了CogVideo(Hong et al. 2022)和CogVideoX(Yang, Teng et al. 2024)系列模型。2024年7...

AI '电子舌头'问世,可辨别味道、检测食品安全

AI“电子舌头”问世,可辨别味道、检测食品安全,帕鲁AI 11 月 7 日消息,宾州州立大学的研究人员开发出一种基于人工智能的“电子舌头”,能够准确识别食品的酸度...

大模型小爱能力升级,多端设备支持「音乐问答」功能

小米官方今日发文宣布,大模型小爱音乐能力升级,多端设备支持「音乐问答」功能。据介绍,该功能基于 AI 能力升级,支持歌曲信息追问、搜索专业音乐知识等内...

快手“可灵 AI”独立应用上线苹果 App Store,支持生成视频与图片

快手公司近期在苹果 App Store 上线了独立的“可灵 AI”应用,进一步加强其在移动端的 AI 内容创作布局。目前,“可灵 AI”已形成了多平台的产品矩阵,包括网页版...

字节跳动推出AI视频生成内测,豆包助手引领行业新趋势

字节跳动旗下的AI助手豆包正式开启视频生成内测,支持图片文字一键成片、动态运镜和多镜头一致性,展现了强大的AI视频生成能力。据火山引擎总裁谭待介绍,豆...

微软推出 Magentic-One:多 AI 智能体协同完成复杂任务

微软本月发布 Magentic-One 系统,通过协调多个专用 AI 智能体,高效处理复杂工作流程。Magentic-One 系统隶属于 AutoGen 开源平台,在不同环境中无缝编排任...

Perplexity AI 搜索公司融资 5 亿美元,市值将破 90 亿美元

消息显示,搜索初创公司 Perplexity AI 即将完成 5 亿美元融资,预计融资完成后公司市值将达到 90 亿美元。本轮融资由风险投资公司 Institutional Venture Pa...

苹果M4系列芯片升级:提升AI处理能力

苹果公司的M4系列芯片升级计划旨在显著提升其云计算机处理Apple Intelligence请求的能力。目前使用的M2 Ultra芯片将有望被新一代M4芯片取代,预计将带来更快...

苹果 Siri AI 进化:将支持读取屏幕、摘要内容、回答相关问题

苹果公司的智能助手 Siri 在本周一发布的新支持文档中显示,其功能将得到显著增强。Siri 将能够更深入地理解用户屏幕上的内容,并据此回答相关问题。这一功能...
1 8 9 10 11 12 13