如果想发一条朋友圈,可以先用软件里的自动识别功能给自己“补个妆”,再去大模型网站,生成几句朋友圈文案;如果想在电商平台购物,可以先让AI客服推荐一个合适的尺码;不会跳舞没关系,上传一张照片就可以让自己在视频里看起来“唱跳俱佳”。
今年春节期间,各大平台“争做”用户主页的“AI技术显眼包”。AI写对联、AI生成表情包动图、AI生成祝福语等层出不穷,甚至还有音乐APP推出“AI一图成曲”,用户上传一张图片即可做成一首歌。
这其中,百度拿出了旗下多个贴近大众又好玩的AI技术,包括智能体与数字人的结合、iRAG技术以及AI语音交互,推出多款适用于春节场景的新功能,融AI于年味,为用户解锁更多AI贺岁的新玩法。
在AI技术还不成熟的曾经,用AI生成的图片、文字、视频常常被称为是“人工智障”,不太会被用户真正使用。
如何让生成的图片或视频更自然、生成的文字更通顺、交互的限制更少,也一直是AI技术在攻克的难题。
而今年春节,几个AI应用现象的爆火,让人眼前一亮,也让我们看到了未来AI应用场景不断拓宽的可能。
教程普遍简单易操作。比如百度中的“瞬移世界拜个年”功能,就已经被广场舞大妈们“玩明白了”,通过这个功能,广场舞大妈们已经解锁了全球地标,一会儿来到美国白宫门口跳一段“最炫民族风”,一会儿又去法国凯旋门前跳一段“酒醉的蝴蝶”,“全球巡演”的梦想也算是实现一半了。
据了解,用户在百度搜索“瞬移世界拜个年”,跟着提示使用“相机录制”录制一段拜年视频,选择背景音乐,再选择拜年背景,简单三步就可以生成在世界任意地点的拜年视频。
除了能实现视频一键抠人像,“瞬移世界拜个年”也可以识别宠物,有网友给家里的两只小猫安排了环球旅行,三步带小猫去了一趟埃菲尔铁塔。
她在网络中找到了一张蒙娜丽莎的图片,导入小程序“百度智能云曦灵数字人”中,选择一条祝福文案、一款方言语音,几分钟后,蒙娜丽莎就“动起来”了,还操着一口可爱的四川话,说着“岁岁平安”。
只需要上传一张照片,等待几分钟,连文案和声音都不需要录入,就可以生成一条表情自然、唇音同步的拜年视频。这让人不禁感叹AI的进步速度。
“早就想自己录一个这种活泼一点的拜年视频,但是学不出那个口音,这次用AI,几分钟就搞定了。”
在这个功能中,选好自己喜欢的拜年文案,就可以点击下方的“做贺卡”按钮,输入收件人与署名,选择图片与贺卡样式,即可生成一张在世界任意地点的超真实新年贺卡。
“之前,AI生成的图‘缺胳膊少腿’,很难保存下来用,这个定制贺卡功能不一样,每个图都好看,也都合理,我给每一个朋友都做了一张。”
有不能回家过年或利用春节错峰旅游的用户,上传了自己的旅行照片作为贺卡图;也有喜欢玩梗的用户,用AI制作了一张自己在月球表面的图片,配文“我在宇宙很想你”。
除了这些来自“送祝福”的小烦恼,春节期间的旅行、医疗服务资源锐减,一些用户想要求助却得不到解答,现在,对着搜索引擎说一句话就可以解决。
李彬利用一个晚饭的时间,就教会了奶奶用方言在百度里搜索问题,“奶奶不会说普通话,这个功能很好用。”
同时,想要在春节期间出门旅行的用户也有了免费咨询的渠道,在百度搜索“春节智能体”,就可以获得34个免费导游,它们分别是34个省级行政区的文旅智能体,不仅能够提供旅行攻略,还可以用方言与用户打电话。
百度在AI上的布局,最早可以追溯到2010年。彼时,其成立了自然语言处理部(NLP),随后还陆续成立了*个人工智能研究院(IDL)和人工智能实验室,吸引了大量业界*的技术人员加入。
2016年,百度多年来的AI战略开始逐渐开花结果,陆续发布了深度语音系统、百度大脑、Apollo自动驾驶等人工智能相关的技术。
在过去的2024年中,百度就频频发布在AI上的最新进展,其中*代表性的就是在智能体上的布局。
此前,微软、谷歌、OpenAI等国际巨头,均对外透露了智能体产品布局计划。如今的AI技术行业格局,已经开始从过去的“百模大战”向“千体大战”转变。
这两年,百度文心智能体平台在技术的迭代下不断发展。截至2024年11月,该平台已经拥有80万开发者和15万家企业。
百度在近期举办的2024百度热AI营销大会上,公布了百度智能体的最新进展,文心智能体为百度搜索带来了多轮对话、超级外脑、创意升级、拟人体验和多元推荐等五大新能力。
在诸多的春节玩法中,AI环球盲盒拜年、让34个省的用户拥有免费导游、一键生成同款智能体等玩法,都得益于百度搜索的智能体技术。
搜索,算得上是智能体落地的*土壤。百度搜索庞大的用户群体以及每日数以亿计的请求量,为智能体提供了天然的用户基础与数据信息支撑。
而成熟的智能体也将给百度搜索带来用户增量,就像这次的几个春节活动,就为百度搜索吸引了不少流量。
该小程序采用的曦灵数字人技术,能准确提取照片中的人脸结构特征,让模型通过学习不同动作下人脸的变化,掌握面部特征变化规律,从让一张照片动起来时,表情也能自然、逼真。
除此之外,百度还在该项技术的开发上,从多个细节考虑和优化,比如人物光线和皮肤质感等因素,让人脸动起来更自然;视频中唇形的表现也颇为重要,百度采用了唇形驱动技术,让人物说话更自然流畅,音唇完全同步。
除了智能体与数字人技术,百度在2024年11月12日“2024年世界百度大会”中发布的iRAG文生图技术则在具有高度真实感的新春贺卡上有所体现。
百度为了解决这一问题,自研了iRAG文生图技术。该技术可以结合百度搜索的亿级图片资源与强大的基础模型能力,结合检索和生成的技术方法,生成更真实的图片,更能让用户接受并使用,成功降低用户的创作成本。
今年春节期间上线的AI做贺卡功能,实则是iRAG技术跨越B端领域,在C端用户身上的一次尝试。目前,iRAG技术已经在影视作品、漫画作品、连续画本、海报制作等很多领域都有广泛的应用空间。
让用户更顺利地用语音使用百度搜索功能,以及34省文旅智能体方言语音交互的背后,则是百度的AI语音能力。
在语音大数据挖掘技术、方言迁移合成技术等支持下,百度的AI方言语音技术也得到了从研发成本到生成效果的全方位优化。
其中,语音大数据挖掘技术可以对不同省份的方言数据做切分、降噪、识别等自动化处理,给方言合成迁移模型提供了大规模的数据支持,也就是给方言语音合成提供规模化、高质量的方言语料;方言迁移合成技术,能够克服之前合成系统需要独立的方言前端、资源耗费大、研发周期长的问题,压缩了研发成本和研发周期。
目前,百度的AI语音技术除了可以快速定制方言音色、任意音色说任意方言,还能实现数字人直播、理解小说文本、生成情感细腻的类真人声等功能。
视频中,小朋友不仅可以用东北话与智能体AI导游对话,与各地的智能体了解当地风俗,还能根据AI导游的建议,规划地道的旅行路线后小学生都可以用AI制作旅游攻略,也意味着AI能力如今更为易用、好用,“一步生成”“一键生成”“一图生成”的AI功能越来越多,“有效利用AI工具”的概念已经在互联网用户心中普遍形成。
此外,多数AI产品的操作界面也越来越简洁友好,功能更加直观易懂,用户已经开始习惯在一些AI小插件中做简单的生成体验和尝试。
不只是北上广深等一线城市的上班族,AI对小城的商店经营者、中老年群体、少年群体也多有帮助,例如老年人与AI互动,了解天气、新闻、听戏曲等。
随着AI应用深度和场景的不断拓宽,到了2025年,行业的主命题已迅速切换为扩大用户规模和探寻成熟的商业模式。
李彦宏也在2025年全员信中表示:大模型赋能的AI原生应用正在各行各业各种场景迅速普及,虽然超级应用尚未出现,AI的实际渗透率已经不低,并且将在2025年继续井喷式增长。
今年春节,百度又引发了这场蛇年春节的AI狂欢,这背后,是一场关于中国大模型技术的全民级落地实验。
展望2025年,在大模型技术越来越成熟,实用性更强的情势下,AI领域也迈入了新的纪元——“应用的平民化元年”,AI应用从简单的问答对话扩展到了写作、作图、做PPT、剪辑视频等各种场景。
据镜报10月19日报道,美国前总统贝拉克・侯赛因・奥巴马在市政厅中的演讲中点名吐槽了唐纳德·特朗普奇怪的舞蹈动作。 本周五晚上,奥巴马在内华达州的市政厅为副总统卡...
周星驰主演的《大话西游之月光宝盒》电影诞生了许多网络世界的经典表情包,不过,上海杨浦区法院近日审结的一起涉动图表情包信息网络传播权纠纷案表明,这些表情包不能再随便用了!...
在北京时间6月1日凌晨结束的2024-25赛季欧冠决赛的较量中,大巴黎5-0横扫国米,队史首次夺得欧冠冠军,并且加冕赛季3冠王。而赛后,激动的大巴黎球迷,除了疯狂庆祝之外,还不忘记抓住...
某短视频公司(以下简称短视频公司)享有涉案电影《大话西游之〈月光宝盒〉》的独家信息网络传播权。某网络公司(以下简称网络公司)是某动图制作与分享网站(以下简称涉案网站)的运营者。在该网站...
据了解,更新微信至最新版本,打开微信视频号的视频评论区,点击“笑脸表情”即可选择微信默认表情或你收藏的表情包发送。 微信视频号评论支持发送动图或静图,每条评论只能...
近日,上海杨浦区法院判决某公司因擅自传播《大线元,引发不少习惯使用动图表情包的用户疑问:随手转发动图表情包会侵权吗? 中国政法大学知识产权法研究所所长付继存表示,...