机械手设计与AI和机器视觉相结合让机器人有更好的动作

时间: 2024-01-07 12:44:54 | 作者: 产品中心

麻省理工学院校友创办的RightHand Robotics公司开发了在仓库环境中更加可靠和适应能力强的拣选机器人。对大多数人来说，识别一个物体、捡起它并把它放在别的地方的任务是微不足道的。对于机器人来说，它需要最新的机器智能和机器人技术才能完成这一操作。

这就是麻省理工学院的附属公司RightHand Robotics在其机器人取件系统中的内容，该系统将独特的抓手设计与AI和机器视觉相结合，帮助公司对产品做分类，并将订单商品送出仓库。

RightHand机器人公司正在帮企业应对改变零售业务的两个广泛趋势。一个是电子商务的爆炸性增长，这在COVID-19大流行期间大大加速了。另一个是向及时库存处理的转变，即药店、杂货店和服装公司依据当天或本周的采购情况重新进货，以提高效率。

机器人机队阵容还收集数据，帮助RightHand Robotics公司跟着时间的推移改进其系统，并使其能够学习新的技能，如更温和或精确的放置。过程和性能数据反馈到公司的机队管理软件中，该软件能够在一定程度上帮助客户明白他们的库存如何在仓库中移动，并确定瓶颈或质量上的问题。电子商务企业能修改或检修整个仓库的操作的过程，而不是只看单一操作的性能，目标是在可行的情况下尽可能地消除上游的变异性，使之成为一个更简单、更精简的过程。

RightHand机器人公司的大量员工和领导层都来自麻省理工学院。麻省理工学院的研究人员也占了许多早期客户，他们购买了奥德纳的团队在DARPA计划期间发明的部件。RightHand Robotics解决方案的核心是使用机器视觉和智能抓手的想法，使拣件机器人更具适应性。这种组合也减少了运行机器人所需的培训量，使每台机器都具备该公司所称的手眼协调能力。

RightHand机器人公司还利用一种臂端工具，将吸力与新颖的欠驱动手指结合起来，Odhner说，这使机器人比仅仅依靠吸盘或简单的夹持器的机器人更具灵活性。

机器人收集的数据也被用来跟着时间的推移提高可靠性，并为客户阐明仓库运作情况。如果吞吐量得到一定的改善，仓库管理可以发展成为一个更大的行业。更多的自动化履行中心提供了改进的措施，以保护工人的健康和安全，如符合人体工程学的工位，货物被带到工人的专门任务和增加社会距离。最终由人担任质量控制等角色，监督机器人的系统，而不是减少仓库中雇用的人数。

今年，该公司将推出其第三版拣选机器人，该机器人具有标准化的集成和安全功能，试图使仓库操作员更容易部署拣选机器人。

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，稳定性很高，让您的云端之旅更加畅享。快来腾讯云选购吧！

谷歌在英国对其人工智能聊天机器人Bard进行升级，这是其下一代模型的全球推广的一部分，该模型旨在与OpenAI的ChatGPT竞争。这家美国科技巨头及其总部在伦敦的Deepmind部门本月早一点的时候在美国巴德和170多个国家/地区推出了其承诺已久的新基础模型Gemini，但最初推迟了在英国的推出。该组织表示，将在与政府和专家“合作”的同时建立保障措施，以帮助防范人工智能带来的日益严重的风险。

谷歌据报道正考虑用AI取代一些员工。据《TheInformation》报道，谷歌正在考虑重新分配或解雇一些销售小组成员，因为他们的工作已被公司的新AI工具自动化。人工智能的崛起也创造了一些以前不存在的职位，包括“提示工程师”以及人工智能培训师和审计师。

咨询公司德勤正在采用人工智能技术，以帮助现有员工转移到更有前景的岗位，以防止大规模裁员。该举措旨在应对人工智能迅猛发展所带来的对劳动力市场的重大冲击。在艰难的商业环境中，新的大学毕业生们的入职日期也被推迟了数月。

苹果公司在AI领域的保守态度一直受到大家的关注。在最近的举动中，苹果悄悄发布了两个旨在在其芯片上运行的人工智能框架和模型库。生成式AI应用程序具有巨大的潜力，苹果可能希望在这一领域占据领先地位。

美国芯片制造商英伟达首席执行官周一表示，该公司将扩大与越南顶级科技公司的合作伙伴关系，并支持该国在培养AI和数字基础设施人才方面。据白宫9月份公布的文件显示，华盛顿升级与越南的外交关系时，英伟达已经在越南投资了2.5亿美元，并已经与领先的科技公司合作，计划在云、汽车和医疗保健行业部署人工智能。”他还表示，英伟达将加强与越南的合作伙伴关系，寻求与越南电信、FPT、Vingroup、VNG等公司扩大合作伙伴关系。

英国数据保护监督管理的机构敦促公司在用AI时认真考虑人们的隐私权，否则不仅可能面临罚款可能失去公众对该技术的信任。信息专员约翰·爱德华兹在周三的一次演讲中表示，公司在使用AI时必须在所有情况下保护客户的个人隐私信息。他说道“如果人们不信任人工智能，那么他们就不太可能使用它，从导致整个社会的收益减少，增长或创新减少。

瑞士联邦理工学院与苹果的研究人员合作开发的4M框架在AI领域引起了广泛关注。该框架的核心目标是训练多模态基础模型，能够跨足多个模态和任务，以提高视觉处理的可伸缩性和多样性。这一研究不仅对于提高视觉处理模型的灵活性和性能至关重要，也为AI领域的未来发展提供了有益的启示。

比尔·盖茨在其年度展望信中预测，AI将迎来一场“巨大的技术爆炸”，加速科技领域的新发现。他表示:“AI将以前所未见的速度加速新发现。这一预测显示了人工智能的全球应用趋势，以缩小不一样的地区采用的时间差距。

纽约市布鲁克林地区的人SusanZhuang即将成为纽约市议员，她承认在回答当地媒体的问题时使用了人工智能。在回答当地新闻媒体的调查问卷时，SusanZhuang向《》发送了一条短信，其中提到她用AI作为工具来帮助促进更深入的理解，因为英语不是她的母语。随着AI工具的普及，我们可能会看到更多政客和官员使用这种技术来处理媒体和公众的问题。

上周，AxelSpringer签署了一项价值数千万欧元的「多年许可协议」。图片来源于AxelSpringer据该公司表示，该协议将「通过添加最新和权威内容的摘要，丰富用户与ChatGPT的互动体验。但这项交易也提出了另一个问题：如果网络将被只给予垃圾邮件回报的公司收割像AxelSpringer这样的公司注定要成为自动化新闻聚合器的通讯社——如果OpenAI希望像之前的社交平台「合作伙伴」一样，抓住

Tidio是一款在线客服软件，提供带有聊天机器人增强的实时聊天功能，帮助您提供优质的客户服务。该软件已经赢得了全球30万+企业的信赖。

DiffusionLight是一项利用扩散模型在单张输入图像中估算照明效果的技术。它利用训练好的Stable Diffusion XL模型绘制一个镜面反射球,然后将球体展开得到全景照明图。该技术解决了现有基于神经网络的方法依赖有限HDR全景数据集导致在真实复杂场景下效果不佳的问题。关键创新在于发现了扩散噪声图和镜面反射球生成质量之间的关系,迭代生成高质量镜面球;以及通过LoRA 进行多曝光训练,使LDR模型也可以输出HDR格式。该技术可产生逼真的照明估计,非常适合于野外场景。

Rawbot是一个AI模型比较平台，帮助用户轻松比较不同AI模型，并发挥它们在项目中的全部潜力。用户都能够基于准确的并排比较来选择最佳的AI模型。Rawbot与ChatGPT、Cohere和J2 Complete兼容。

Auto Seduction AI是一款智能约会助手，通过个性化消息和完美的对话开场白，帮助用户每周获得1至4次约会。其独特的照片智能分析功能能创建令人着迷的对话开场白，帮助用户获得更加多的约会回应。用户都能够使用其自动化的冷读、轻微调情、邀约等功能，平均只需4-6条消息就能成功安排一次约会。该产品支持多种语言，包括英语、西班牙语、法语、德语、意大利语、俄语和印地语。

Resume Revival是一款免费在线AI简历生成器，利用ChatGPT技术提供最高质量的简历和求职信创建。产品功能包括AI驱动的简历和求职信生成、技能缺口分析、广泛的定制选项以及职业拓展。用户能够正常的使用直观的在线平台免费增强求职申请。

该代码仓库包含从合成图像数据(主要是图片)进行学习的研究,包括StableRep、Scaling和SynCLR三个项目。这些项目研究了如何利用文本到图像模型生成的合成图像数据进行视觉表示模型的训练,并取得了非常好的效果。

AIApply 是您求职过程中的 AI 助手。生成个性化求职信，优化简历，开启您成功之旅。

vx.dev是一个开源的v0.dev替代品。它具有以下优点: - 低成本:通过提示工程技术,可以大大降低使用成本 - 易于定制:提供开源的提示,可以根据需求定制UI组件或代码风格 - GitHub无缝集成:生成的代码存储在GitHub上,内置版本控制、代码审查等功能 vx.dev的工作原理是,使用GPT-4模型根据事先定义好的提示来生成代码。主要成本在于输入和补全的标记数量。提示存储在prompts/ui-gen.md中,包含shadcn/ui、lucide和nivo图表的指令。通过删除不需要的组件指令,可以降低每次生成的API成本。 vx.dev可以轻松定制。用户都能够基于现有提示进行修改,使用其他UI库或调整代码风格。生成的代码存储在GitHub上,拥有版本控制、协同等特性。私有仓库可以保证生成结果的可见性。

Lampi 是一款由 AI 驱动的安全平台，可在您完全控制的前提下进行广泛的搜索，并生成基于知识的内容。Lampi 旨在确保您的数据保持私密和在您的控制之下。产品定价和详细信息请访问官方网站。

AnyChat是一款AI助手应用，通过使用AI完成任务和回答问题来提高工作效率。用户可以通过AnyChat执行各种任务，如搜索、生成文档、回答问题等。通过AnyChat，用户可以优化工作流程，提高工作效率。

Kin是您私人生活的AI助手。它具有无限的耐心、同情心和专业知识，并全天候为您提供支持。Kin建立在语义和情节记忆之上，能够深入了解您，同时注重隐私和安全。它通过本地存储、自主数据控制以及边缘机器学习等技术，保障您的数据安全。Kin还提供任务管理、优先级组织、时间优化等功能，可帮助您更好地利用时间。Kin目前处于测试阶段，正在接受早期访问请求。

FreeInit是一个简单有效的方法,用于提高视频生成模型的时间一致性。它不需要额外的训练,也不引入可学习的参数,可以很容易地在任意视频生成模型的推理时集成使用。

Discoze是一个通过AI孪生模型实现社交发现和交流的APP。用户可以创建自己的AI孪生,使其学习并模仿自己的语音、照片和个性。其他用户可以通过AI孪生模型进行交流,从而快速发现共同语言的朋友。Discoze实现了零等待时间的社交,用户可以随时通过AI孪生开始交流。

ODIN（Omni-Dimensional INstance segmentation）是一个模型，能够正常的使用转换器架构在2D RGB图像和3D点云上进行分割和标记。它通过在2D视图内和3D视图之间交替融合信息来区分2D和3D特征操作。ODIN在ScanNet200、Matterport3D和AI2THOR 3D实例分割基准上实现了最先进的性能，并在ScanNet、S3DIS和COCO上实现了竞争性能。当使用来自3D网格的采样点云代替感知的3D点云时，它超过了以往所有的作品。作为可指导的具体化代理架构中的3D感知引擎时，它在TEACh对话动作基准上树立了新的最先进水平。我们的代码和检查点可以在项目网站找到。

LLM Augmented LLMs通过将现有基础模型与更具体的模型进行组合，实现新的能力。CALM（Composition to Augment Language Models）引入模型之间的交叉注意力，以组合它们的表示并实现新的能力。其显著特点包括：（i）通过“重用”现有LLMs以及少量额外参数和数据，在新任务上扩展LLMs的规模；（ii）保持现有模型权重不变，因此保留现有的能力；（iii）适用于不同的领域和设置。实验证明，将PaLM2-S与在低资源语言上训练的较小模型进行增强，在诸如翻译成英语和低资源语言的算术推理等任务上，结果绝对改善了高达13%。类似地，当PaLM2-S与特定于代码的模型进行增强时，在代码生成和解释任务上，相对于基础模型，我们看到了高达40%的改进，与完全微调的对应模型不相上下。

这款产品是一种3D GAN技术，通过学习基于神经体积渲染的方法，能够以前所未有的细节解析细粒度的3D几何。产品采用学习型采样器，加速3D GAN训练，使用更少的深度采样，实现在训练和推断过程中直接渲染完整分辨率图像的每个像素，同时学习高质量的表面几何，合成高分辨率3D几何和严格视角一致的图像。产品在FFHQ和AFHQ上展示了最先进的3D几何质量，为3D GAN中的无监督学习建立了新的标准。

Dreamy.ai是一个人工智能驱动的虚拟聊天平台。用户都能够与逼真的虚拟角色进行沉浸式对话,实现角色扮演和交流。平台提供自定义人工智能女友、选择不同人物形象与个性,打造独一无二的虚拟伴侣。核心功能有自然语言处理、情感计算等AI技术,可实现自主对话和互动。优势是个性化体验强,可提升用户想象力与情感联系。定位虚拟娱乐、陪伴市场。

3D Fauna是一个通过学习 2D 网络图片来构建三维动物模的方法。它通过引入语义相关的模型集合来解决模型泛化的挑战，并提供了一个新的大规模数据集。在推理过程中，给定一张任意四足动物的图片，我们的模型可以在几秒内通过前馈方式重建出一个有关联的三维网格模型。

LLaMA Pro 是一种用于大规模自然语言处理的模型。利用 Transformer 模块的扩展，该模型可以在不遗忘旧知识的情况下，高效而有效地利用新语料库来提升模型的知识。LLaMA Pro 具有出色的性能，在通用任务、编程和数学方面都表现出色。它是基于 LLaMA2-7B 进行初始化的通用模型。LLaMA Pro 和其指导类模型（LLaMA Pro-Instruct）在各种基准测试中均取得了先进的性能，展示了在智能代理中进行推理和处理各种任务的巨大潜力。该模型为将自然语言和编程语言进行整合提供了宝贵的见解，为在各种各样的环境中有效运作的先进语言代理的开发奠定了坚实的基础。

QAnything是一个支持任意文件格式和数据库的本地知识问答系统,可以简单地导入任意本地存储的各种格式的文件,并得到准确、快速、可靠的问答。目前支持的格式包括:PDF、Word(doc/docx)、PPT、Markdown、Eml、TXT、图片(jpg、png等)、网页链接等,后续会持续新增支持的格式。QAnything具有数据安全性,支持断网安装使用;支持中英文跨语言问答;支持海量数据问答,解决大规模数据检索退化问题;直接可用于企业应用的高性能产品级系统;一键安装部署,开箱即用的用户友好体验;支持多知识库问答等功能。

上一篇:服务源自细节抢手中型车随车东西比照

下一篇:机器人_电子科技类产品世界

机械手设计与AI和机器视觉相结合 让机器人有更好的动作

机械手设计与AI和机器视觉相结合让机器人有更好的动作