【论文梳理】Understanding Contexts Inside Robot and Human Manipulation Tasks through Vision-Language Model and Ontology System in Video Streams

一、研究背景近期,将计算机视觉与语言知识融合的进步,使研究人员能够利用上下文语义,给智能机器人建模人类式的常识性知识。机器人视觉和自然语言处理的研究给了机器人有力的工具,让机器人能更好地理解人的行为并帮助人类。但是机器人在两个方面具有...

Pytorch训练图像分类网络

机器人学导论实验:Training an image classifier 一、实验目的利用Pytorch在CPU/GPU上训练一个图像分类网络 二、实验步骤 加载并预处理 CIFAR-10 数据集,包括划分训练集和测试集,并应用图像...

踩坑日记

Git问题:解决“ssh:connect to host github.com port 22: Connection timed out” 一、问题描述 将修改的代码上传github时,遇到了 二、解决方案 ssh默认连接22端口,...