暴走1万步,36氪带你看AI春晚|直击WAIC 2023
作者|杨潇、林伟新
绘画|于静琳
编辑|苏建勋
大模型之风已经吹了半年,2023年世界人工智能大会(WAIC)成为不可或缺的盛会。
7月6日,世界人工智能大会在上海世博会馆正式开幕。 本届WAIC参展企业超过400家,首次参展产品超过30种。 会议云集国内外知名学者、知名企业家、国际组织代表等嘉宾1400余人,国内外院士80余人。
可以说暴走1万步,36氪带你看AI春晚|直击WAIC 2023,这里有全球知名的人工智能专家和企业家,特斯拉CEO埃隆·马斯克(Elon Musk)、华为轮值董事长胡厚昆、微软全球高级副总裁、微软大中华区董事长兼CEO侯阳, Horizon创始人兼CEO余凯、图灵奖得主杨立坤(Yann LeCun)、微软前执行副总裁、美国国家工程院外籍院士沉向阳以及IEEE CEO拉曼……
与热闹的学术和工业节相比,展馆内的展品并不逊色。 大模型、机器人、自动驾驶等企业都在竞相秀肌肉。 这或许是距离未来最近的地方。
自从大模型流行以来,AI绘画、AI写作、AI诗歌等已经不再是新鲜事。
展会上,腾讯带来了AI游览长城的体验。 站在展厅中央,就像站在长城城墙上,可以看到墙外的高大树木和城墙上的砖瓦;
商汤科技为篮球运动带来了智能篮球场,无需摄影师即可记录三分球的精彩瞬间;
还有人体支架之类的康复机器人、切割手术的微创机器人、会翻筋斗的检查机器人等,真是让人眼前一亮。
在上海30度的湿度下,36氪深度探访了今年的WAIC,为大家带来了第一手的AI报道,以及那些即将借助AI走进大众生活的智慧体验。
1. 玩转人工智能应用
除了写诗、画画,AI还可以成为你的专属宫廷摄影师和24小时口语教练,让你畅游长城、神州大地。
商汤智慧篮球场与米花
实时记录三分球投篮的高光时刻不再是梦想。
每个打球的人可能都想成为众人瞩目的焦点。 现在英语口语陪练机器人,商汤科技的SenseShot智能篮球场可以帮助您实现您的愿望。
在AI能力的加持下,这座体育场实现了比赛的无人直播。 当你站在球场上时,直播摄像机会自动跟踪篮球和球员移动镜子,实现“推/拉/摇/移”的直播效果。 直播屏幕还可以实时显示比赛比分。
比赛结束后,您可以看到自己和球队的精彩视频集锦、AI运动分析等。
团队利用2D关键点提取和3D视频动作捕捉技术对球场进行3D建模。 市民输入人脸信息后,系统将自动捕捉人脸和身体的29个关键点以及篮球,进行单人/多人比赛。 逻辑计算和分析。 有了每个人在空间的三维坐标,就可以自动跟随摄像头、个人视频精彩片段,分析人在不同运动状态下的动作特征。
SenseShot~智能篮球场
据商汤工作人员介绍,实现这样的运动数据训练和轨迹捕捉只需要一周左右的时间。
除了智慧篮球场之外,商汤科技还展示了其屏幕生成功能的SenseMirage秒图功能。
SenseMirage第二张图
不懂代码也没关系,只要输入简单的提示(文字描述)英语口语陪练机器人,商汤秒花平台就能生成你想要的图片,并且支持二维、三维等多种风格-维度。 这背后是基于商汤科技“每日上新”模式的支撑。 例如,如果你将20张港式照片拖到弥花平台上,只需要几分钟就可以得到一个可以生成港式照片的大模型。
腾讯AI畅游长城
在腾讯展位上,腾讯游戏将整条长城搬到了手机上。 用户只需踩在长城上,打开按钮,就可以通过裸眼3D全息投影畅游长城。
这背后我想展示的是腾讯的云游长城。 为了提高用户体验,开发团队采用自主研发的AI技术来提升画面质量。 我们不仅可以看到长城上的砖纹,还可以在长城的石阶上看到一只蝴蝶飞过树枝。
腾讯~AI畅游长城
借助数据自动生成、植被模型处理等AI能力,真实再现了长城的峡谷、山峰、悬崖、海岸等不同地形,不同高差、不同植被类型。 实现了毫米级的长城主体,以及早晨、中午、傍晚、深夜不同时间的光影互动,以及动态植被、鸟类、昆虫、昆虫等特效。云。
网易有道口语教练
寻找会口语英语教练不再是问题。
虚拟人口口语教练是网易有道首个自主研发的大型模型“子曰”在教育领域的应用成果,希望成为普通人英语口语练习的神器。
口语教练不仅形象逼真、发音地道,还可以进行开放式对话,适应不同英语水平的用户。
网易有道~口语教练
在对话过程中,口语教练就像老师一样,提供循序渐进的指导、启发式学习陪伴和实时反馈。 在生成对话报告时,AI老师会从发音、语法等维度给出建议和润色,尽量帮助英语口语学习者。
该产品目前还处于内测阶段,即将上线,可在网易有道等产品中免费使用。
出门问问妙元3D数字人
所有短视频达人都使用的数字人创作平台就是秒缘。
该平台由摩门文创新团队打造。 拥有数十个高保真数字人、3D数字人,还有百余个高品质音箱可供选择。 平台提供一站式服务,只需5分钟,简单4步,即可批量生成你想要的视频内容。
展会上,一位戴着跟踪定位装置的小姐姐在前面跳舞,后面的视频正在实时生成3D动画人物。
出去问问~妙元3D数字人
懂玩的朋友还可以在《幻缘》中制作属于自己的数字化身,前期只需要收集5分钟的有效角色视频,就可以打造媲美真人的AI数字化身。
弥渡手稿通:一位诗人
弥渡展区里站着一个“AI诗人”,只要你告诉它你想要的主题风格,比如“故乡”、“青春”、“塞外大漠”等提示词,它就会能够当场赋诗,给你一首符合主题的现代诗。
弥渡手稿
“AI诗人”是米读漫稿通推出的AI辅助创作工具。 除了写诗之外,漫稿通还涵盖媒体稿件、政府文件、企业办公等不同应用场景。 功能方面,Manuscript拥有AI写作、续写、图片匹配、校对四大模块,用户可以一站式完成稿件写作。
2.机器人来了
机器人无疑是本次展会的亮点之一。
医疗机器人、巡检机器人等产品借助人工智能技术,掌握了灵活的避障、行走、作业能力,可以作为生产力工具进入工业、医疗现场,帮助减轻人们的工作压力。
人形机器人因其高硬件难度、高软件智能、高情感感知能力而被称为机器人界难以攀登的珠穆朗玛峰。 长期以来,只有技术一流、商业化场景未知的波士顿动力公司支撑着这条赛道。 大型模型技术爆发后,其流畅的对话能力重新点燃了学术界和工业界对人形机器人的期待。
特斯拉擎天柱
这个领域最大的亮点应该就是特斯拉的擎天柱了。 开幕式上,马斯克还通过连麦宣传了自己的擎天柱,称特斯拉希望用擎天柱来代替重复、枯燥的人类劳动。 还有危险的部分。 未来,该产品将首先应用于工厂。
不过,在展台上英语口语陪练机器人,特斯拉并没有带来真正的“人类”擎天柱,只是展示了它的模型。
据特斯拉展台工作人员介绍:“擎天柱搭载的是D1芯片,只能实现动作交互。对话和情感交互还在开发中。未来我们还会想开发C端场景,比如作为护送、遛狗,目前价格和Model Y差不多,暂时不会量产。”
特斯拉擎天柱
傅里叶仿人机器人和外骨骼机器人
傅里叶在开幕式上展示了他们的人形机器人GR-1。 他身高1.65米,体重110斤,属于标准健康体重。
为了实现这样的能力,GR-1全身有40个关节,最大关节模块峰值扭矩可达300NM,行走速度可达5KM/h,可承受50公斤的负载。
傅里叶仿人机器人
它具有良好的运动能力,整个身体高度仿生,运动控制也呈现拟人化的姿势。 它可以执行快速行走、敏捷避障、上下坡平稳、抗冲击干扰等动作。 未来GR-1可应用于抢险救灾、养老、家政服务等应用场景。
傅里叶还带来了一个外骨骼机器人上台,主打康复。
傅里叶外骨骼机器人
该产品主要用于帮助患者康复。 当身体不方便时,身体的肌肉不会萎缩,有利于身体残疾的人恢复运动功能。
达达人形机器人
让机器人跳舞有多难? Data推出的服务机器人云姜1.0(小姜)表示,就是这么简单。 当你对小江说“我们跳舞吧”时,小江就会开始随着音乐跳舞。 更何况,小蒋的身体并不僵硬,手臂灵活,出点准确。 最重要的是,小蒋给人一种舒展、放松的感觉,打破了我们对机器人的刻板印象。
据工作人员介绍,小江身高158厘米,配备34个智能柔性关节SCA,还内置多个2D/3D摄像头、激光雷达、超声波传感器等,小江的大脑配备了自主研发的HARIX OS操作系统,赋予小江AI能力。
飞镖机器人
其实,小江不仅会跳舞,还会煮咖啡。 得益于高精度的传感器和控制系统,小江制作的咖啡可以精确到每一滴。
不过,目前达达推出的机器足仍是单柱形式,并非双足人形姿势。 其使用场景主要应用于商场、银行、展览、养老院等迎宾场景。
ARIS-8848 ARIS-8848高原科研机器人
机器人ARIS-8848很酷,它已经登上了珠穆朗玛峰。
去年5月,为了保障珠穆朗玛峰气象科考队的气象勘察工作,UAI智和基于巡检机器人的技术框架和商业案例积累,花了一年的时间进行产品设计和打磨,推出了高原巡检机器人。科考机器人ARIS -8848。
友爱智和-攀登珠穆朗玛峰
针对青藏高原高海拔、超低温、复杂地形,ARIS-8848拥有履带式移动底盘,可在沙地、碎石地、冰川等复杂路面上行驶。 多种传感器可以识别复杂的地形和障碍物。
除了攀登珠穆朗玛峰,ARIS-8848更能够在低温环境下运行,信号传输稳定,辅助科研工作顺利进行。
Reelman双臂复合起重机器人
Reelman实际上是一家机械臂公司。
Reelman的双臂复合升降机器人定位为家庭服务管家。 当你需要一杯水时,机器人会帮你从厨房里拿出来并为你服务。 当您需要收拾杂物时,机器人可以按照您的指令进行操作。 自动存储物品。 即使你晚上躺在床上,懒得起床关灯,只要叫个机器人就可以了。
为了让机械臂更贴近普通用户的家庭场景,Rialman对核心部件采用了全链接、强耦合的设计方法,达到了机身重量6Kg(含控制器7.2Kg),额定负载5Kg英语口语陪练机器人,负载重量6Kg。 比例达到1:1.2,最大负载9Kg。
同时,Rialman将大型模型产品接入机器人操作系统,提升了语音交互体验。
Reelman双臂复合起重机器人
云深科技聚影Lite3和X20
检查是机器狗的常见场景。
展厅内,云深带来了聚影Lite3和聚影X20产品。
绝影Lite3主要应用于教育、科研场景,有助于呈现编程效果。 爵影X20是一款电力巡检及特种应用机器人。 Lite3展示了跟斗特技,绝影X20也展示了上楼梯的效果。
绝影X20的最高速度为4.95m/s,可承载20kg的负载,可以爬20cm的楼梯,跳过1m宽的沟壑,还可以在废墟中行走。
云深科技~绝影四足机器人
绝影X20拥有IP66防护等级。 工作台可搭载双光云台、机械臂、调试架、4G/5G模块、北斗/GPS/RTK模块等,在环境感知方面,可实现自动目标检测与识别。 深度摄像头、激光雷达和智能算法可以实现精准导航、动态避障、人机交互等功能。
目前,绝影X20与电力巡检和特殊应用两大场景紧密结合。 绝影X20可以完成从自主规划路线、采集巡检数据、生成巡检报告、到自主充电、循环作业的巡检全流程。 在火灾探测场景中,绝影X20可以灵活开展无人探测和搜救工作。
微创机器人
机器人也可以进行手术,而且还可以远程操作。
“图麦”胸外科机器人是外科医生的好帮手。 该机器人由上海微创医疗机器人有限公司自主研发,是目前唯一由中国企业研发并获准上市的四臂腹腔镜手术机器人。
“图麦”已在全国20多个省份40多家医院完成1000余例临床验证。 手术全面覆盖了胸腔、腹腔、盆腔等一系列疑难微创。 手术过程中,“图麦”可以帮助医生实现精准识别、精准切除、精准解剖。
微创机器人
“图麦”在5G超远程手术中也得到了临床验证。 据介绍,2022年6月11日,“图麦”连接新疆克州和江苏南京,跨越近5000公里,成功完成两例泌尿外科超远程手术,实现了全球最长的5G远程机器人手术迄今为止 。
据展台工作人员介绍,与进口手术机器人相比,同等性能下,图迈的成本价格“有非常大的优势”。
3.这些硬件可能会改变未来
科技总是先成为创新产品,然后逐渐走进生活。
会上还展出了一些有趣的、可以改变人们日常生活的新技术产品。 送餐无人机、新的掌上支付代码和自控车载充电器。
随着商业化的进步和推广,它们可能会从科技展厅飞到每个人的生活中。
美团第四代无人机
为了送餐,美团使用了无人机,将自动驾驶发挥到了极致。
美团展出了最新的第四代无人机,采用六轴飞行器,最大载重2.5公斤,满载时最大配送距离10公里。 半径3公里内的外卖配送时间一般不超过15分钟。
美团第四代无人机
与上一代相比,新车型不仅性能更出色,对环境的适应能力也更强。 即使在“零下20度至50度”的雨雪大风天气下,也能安全运行。
目前,美团无人机仅落地深圳、上海等城市15条航线,大部分配合外卖人员完成日常配送。
微信掌上支付
借助机器视觉能力,支付方式正在一步步改变。 从最早的摄像头扫描二维码,到人脸识别。 如今,微信推出了刷手掌支付功能,可以识别更详细的手掌纹路。
微信掌上支付
使用微信掌上支付,只需输入掌纹,消费时伸手即可完成支付。 与刷脸支付相比,刷掌支付在安全性和准确性方面更高。
据介绍,北京部分地铁线路推出了刷掌乘车服务,乘客可以用手进出站。
猜你喜欢
发表评论
评论列表