AI模型

字节跳动 X-Portrait2 技术:引领 AI 视频驱动的新时代

字节跳动智能创作团队提出的 X-Portrait2 单图视频驱动技术,实现了仅凭一张静态照片和一段驱动视频生成高质量、电影级视频的突破。该技术不仅能保留原图身份...

谷歌 Gemini 2.0 AI 模型现踪迹,响应速度更快

谷歌公司正酝酿 Gemini 2.0 版本更新。根据最新曝光的截图,Advanced 用户在 AI 模型选择界面中,可以看到 Gemini 2.0,初步测试结果显示,相比较 Gemini 1.5...

CogVideoX + CogSound: Enhancing Silent Videos with Immersive Sound Effects

早在2021年,我们便开始了大规模训练视频生成模型的探索,先后推出了CogVideo(Hong et al. 2022)和CogVideoX(Yang, Teng et al. 2024)系列模型。2024年7...

字节跳动推出AI视频生成内测,豆包助手引领行业新趋势

字节跳动旗下的AI助手豆包正式开启视频生成内测,支持图片文字一键成片、动态运镜和多镜头一致性,展现了强大的AI视频生成能力。据火山引擎总裁谭待介绍,豆...

Perplexity AI 搜索公司融资 5 亿美元,市值将破 90 亿美元

消息显示,搜索初创公司 Perplexity AI 即将完成 5 亿美元融资,预计融资完成后公司市值将达到 90 亿美元。本轮融资由风险投资公司 Institutional Venture Pa...

GPT-4o 加钱能变快,新功能“预测输出”7 秒完成原先 23 秒的任务

GPT-4o 加钱能变快,新功能“预测输出”7 秒完成原先 23 秒的任务,OpenAI 出了个新功能,直接让 ChatGPT 输出的速度原地起飞!这个功能叫做“预测输出”(Predict...

Instagram 利用 AI 技术识别青少年谎报年龄行为

Instagram 计划使用人工智能技术来识别青少年用户谎报年龄的行为。这项技术被称为“成人分类器”,它将分析用户的账户数据,包括关注者列表、互动内容以及朋友...

ChatGPT AI 搜索还不是“谷歌杀手”:关键字搜索不靠谱

ChatGPT AI 搜索虽然在处理复杂问题时表现出色,但在处理简短的关键字搜索时不够可靠,容易出现错误信息。OpenAI 计划在未来几个月内根据用户反馈不断改进这...

OpenAI CEO 阿尔特曼预测 AGI 可在 5 年内实现,但短期社会影响不大

OpenAI CEO 阿尔特曼一直对通用人工智能(AGI)充满热情,并表示公司正在积极追求这一雄心勃勃的目标。在最近的一次 Reddit AMA 中,阿尔特曼声称,使用现有...

Claude 3.5 Haiku AI Model: A Cost-Effective Alternative to GPT-4 Mini and Gemini 1.5 Flash

Claude 3.5 Haiku AI模型是Anthropic公司最新发布的一款语言模型,其性能在多项AI基准测试中超过了Anthropic之前最大的模型Claude 3 Opus。这款模型在文本模...

英伟达团队机器训练新方法:仅 5 次演示让机器生成 1000 个新 demo

英伟达团队提出了一种新的机器训练方法,名为 DexMimicGen,该方法能够通过仅5次演示,让机器生成1000个新的演示(demo)。这一创新解决了机器人训练数据缺乏...

机器狗“职业”再加一:2024杭州马拉松首次启用四足机器人配速员

在2024杭州马拉松中,四足机器人首次被用作官方配速员,其配备了“半马收尾”配速员气球,以稳定配速为跑者提供科学跑步节奏。机器人配速员的投用在国际马拉松...

GPT-4安全漏洞:十六进制字符串绕过防护机制

研究人员发现了一种绕过GPT-4安全防护机制的方法,即通过十六进制字符串转换,成功地让GPT-4编写出了恶意攻击程序。 这一发现揭示了AI模型在处理复杂指令...

中国电信 TeleAI 星辰语音大模型升级:支持中英双语及 40 种方言任意混说

中国电信人工智能研究院(TeleAI)在2023年5月发布了业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型。这一创新技术使得用户能够...
1 2 3