阿里云“魔搭社区”现已上线灵动人像功能 Live Portait,上传一张照片和一段文本或语音即可生成一段开口说话的数字人视频。
用户进入应用界面后上传形象照片,可选择文本驱动(100 字以内)或音频驱动,提供 28 种声音选择,若唇齿生成不清晰,可选择开启“唇齿修复”功能。此外,用户还可设置眨眼频率,在 0-4 之间选择,0 代表不眨眼。
设置完成后,上传图片可以像视频一样进行播报,可应用于视频直播、聊天机器人、企业营销等场景。据介绍,Live Portait 相关技术已被 CVPR、ICCV 等国际 AI 顶会收录。
魔搭社区上架两款开源模型 Qwen-7B 和 Qwen-7B-Chat,阿里云确认其为通义千问 70 亿参数通用模型和对话模型,两款模型均开源、免费、可商用。其中,Qwen-7B 是支持中、英等多种语言的基座模型,而 Qwen-7B-Chat 是基于基座模型的中英文对话模型。
公开资料显示,魔搭是阿里达摩院与中国计算机学会(CCF)开源发展委员会在 2022 年联合推出的国内首个 AI 模型开源社区,把 300 多个模型开放给中国的 AI 研究者与团队,涵盖了自然语言处理,视觉、语音、多模态等模型。
数据统计
数据评估
本站ChatGPT大全提供的魔搭社区都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由ChatGPT大全实际控制,在2023年8月16日 下午5:49收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,ChatGPT大全不承担任何责任。
相关导航

「快意」大模型(KwaiYii) 是由快手AI团队从零到一独立自主研发的一系列大规模语言模型(Large Language Model,LLM),当前包含了多种参数规模的模型,并覆盖了预训练模型(KwaiYii-Base)、对话模型(KwaiYii-Chat)。这里面我们介绍13B规模的系列模型KwaiYii-13B,其主要特点包括: KwaiYii-13B-Base预训练模型具备优异的通用技术底座能力,在绝大部分权威的中/英文Benchmark上取得了同等模型尺寸下的State-Of-The-Art效果。例如,KwaiYii-13B-Base预训练模型在MMLU、CMMLU、C-Eval、HumanEval等Benchmark上目前处于同等模型规模的领先水平。 KwaiYii-13B-Chat对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务,人工评估结果表明KwaiYii-13B-Chat超过主流的开源模型,并在内容创作、信息咨询和数学解题上接近ChatGPT(3.5)同等水平。