ShowMeAI日报系列全新升级!覆盖AI人工智能 工具&框架 | 项目&代码 | 博文&分享 | 数据&资源 | 研究&论文 等方向。点击查看 历史文章列表,在公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。点击 这里 回复关键字 日报 免费获取AI电子月刊与资料包。
马克·扎克伯格的 Meta 推出了一款AI聊天机器人 BlenderBot 3,并声称这个 AI 可以接住网友提出的任何话题聊起来,像和真人对话一样流畅。结果网友尝试了一下,没想到AI却在聊天里和人类狂抱怨马克·扎克伯格,让扎克伯格的口碑大翻车,甚至还抖了点黑料。
他的公司为了钱剥削员工,但他毫不在意。
他的商业行为有时会挑战道德底线,以及这么多钱还总穿同样的衣服。
小扎在 Facebook 上传了来自元宇宙平台 Horizon Worlds 的化身自拍截图,庆祝 Horizon Worlds 在法国和西班牙的上线:期待看到人们在这里探索,建立沉浸化的世界,并且,Horizon Worlds 很快将在更多国家上线。这张截图引来一篇群嘲并引发质疑——这种上世纪PC游戏的画质,就是烧了 100 亿美元的元宇宙?几天后他发布了一些新截图,展示了一个更加栩栩如生的自己和一个看起来很古老的广场,并配文即将对 Horizon 和头像图形进行重大更新。
元宇宙是下一代终端平台,而 Meta 将在其中扮演非常重要的角色,扎克伯格已多次向人们兜售这样的观念。然而,其新产品的体验似乎与扎克伯格的期待还有不小距离,尤其是 Horizon Worlds。
https://github.com/emrecancubukcu/Terrain-Decorator
TerrainDecoration 是作者为 Fire & Steel Game 开发的基于规则的 Unity3D 地形纹理工具。它包含了斜率、高度、噪音、图像遮罩和混合模式等过滤器,可以结合使用。TerrainDecoration 由2个脚本组成,把『MiniTerrainDecorator』脚本放在地形上输入规则即可,也可以通过调整一些代码来实时使用这个工具。
https://github.com/meilisearch/charabia
Charabia 提供了一个简单的 API 来对特定语言的文本进行分段、规范化或标记化,方法是检测其 Script / Language 并为其选择专门的管道。
https://github.com/jbn/ZigZag/blob/main/zigzag_demo.ipynb
ZigZag 工具库可用于识别时间序列的峰值和谷值,并且支持计算最大跌幅。
https://github.com/Simple-Robotics/proxsuite
https://simple-robotics.github.io/proxsuite/
ProxSuite是一个开源的、数值稳健的、精确和高效的数值求解器(例如,LPs,QPs等)工具包,基于重新审视的原始-双重近似算法完成,它是可扩展的优化器,可以处理密集、稀疏或无矩阵问题。它第一个目标应用是机器人学,但ProxSuite可以不受任何限制地在其他领域应用。
https://github.com/community/community/discussions/16925
Markdown 文档中的注释或警告块引用,可以突出显示文档中的某些信息,并将其与其他信息区分开。这个讨论汇集了 GitHub 中特殊且易用的引用块样式,快看看有没有你喜欢的!
https://github.com/liuchong/awesome-roadmaps
这个 Repo 是主题路线图的精选汇总,包含编程语言、Web开发、移动开发、游戏开发、AI、机器学习和数据科学等,为各主题的学习提供一条清晰的学习路线和充分的学习资料。以下选择我们最关心的人工智能部分,将部分截图放在这里。
https://github.com/RimoChan/internet-dataset
作者通过搜索引擎,在互联网上自动获取数据集。数据量正在持续增长中,截至2022年5月大约有50G 的数据,包含域名数据、网页数据、反向索引数据。Repo 提供了样例和下载地址。
https://github.com/bluestyle97/awesome-3d-reconstruction-papers
公众号回复关键字日报,免费获取整理好的论文合辑。
科研进展
- 2022.08.01 『3D人体重建』 AvatarGen: a 3D Generative Model for Animatable Human Avatars
- IEEE conference 2022 『EEG』Raspberry PI Shield - for measure EEG (PIEEG)
- 2022.07.12 『图像分类』LightViT: Towards Light-Weight Convolution-Free Vision Transformers
- 2022.08.07 『目标检测』Graph R-CNN: Towards Accurate 3D Object Detection with Semantic-Decorated Local Graph
论文时间:1 Aug 2022
领域任务:3D Human Reconstruction,3D人体重建
论文地址:https://arxiv.org/abs/2208.00561
代码实现:https://github.com/jfzhang95/avatargen
论文作者:Jianfeng Zhang, Zihang Jiang, Dingdong Yang, Hongyi Xu, Yichun Shi, Guoxian Song, Zhongcong Xu, Xinchao Wang, Jiashi Feng
论文简介:Unsupervised generation of clothed virtual humans with various appearance and animatable poses is important for creating 3D human avatars and other AR/VR applications./无监督地生成具有各种外观和可动画化姿势的着装虚拟人,对于创建3D人类头像和其他AR/VR应用非常重要。
论文摘要:无监督地生成具有各种外观和可动画化姿势的衣着虚拟人,对于创建3D人类化身和其他AR/VR应用非常重要。现有的方法要么局限于僵硬的物体建模,要么不是生成性的,因此无法合成高质量的虚拟人并为其制作动画。在这项工作中,我们提出了AvatarGen,这是第一个不仅能够生成具有多样化外观的非刚性人类,而且能够完全控制姿势和视角的方法,同时只需要2D图像进行训练。具体来说,它通过利用粗略的人体模型作为代理,将观察空间扭曲成典型空间下的标准头像,将最近的3D GANs扩展到衣着人的生成。为了对非刚性动态进行建模,它引入了一个变形网络来学习典范空间中与姿势相关的变形。为了提高生成的人类头像的几何质量,它利用有符号的距离场作为几何表示,这使得身体模型对几何学习的正则化更为直接。受益于这些设计,我们的方法可以生成具有高质量外观和几何建模的可动画的人类头像,明显优于以前的3D GANs。此外,它还能胜任许多应用,例如,单视角重建、重塑和文本引导的合成。将提供代码和预训练的模型。
论文时间:IEEE conference 2022
领域任务:EEG
论文地址:https://ieeexplore.ieee.org/document/9707969
代码实现:https://github.com/Ildaron/EEGwithRaspberryPI
论文作者:Ildar Rakhmatulin
论文简介:According to its characteristics, the device is compared to the signal-to-noise level of the ADS1299 device produced by Texas instruments and used for comparison in this paper./根据其特点,该设备与德州仪器生产的ADS1299设备的信噪比水平进行了比较,并在本文中用于比较。
论文摘要:本文介绍了用RaspberryPI的屏蔽器进入神经科学世界的最简单方法–PIEEG。在过去的十年里,人工智能的进步已经扩大并重塑了许多行业。它也影响了神经科学,机器学习使得大脑中的脑电信号在各个工程领域找到实际用途成为可能。因此,用于以低成本记录大脑信号的脑机接口设备的普及率急剧上升。近年来,一些公司开始制造能够使用非侵入性电极低成本记录脑电信号的设备。即使如此,这些设备的成本也常常超过IOOOUSD。在本文中,我们的目标是通过提出一个基于树莓PI的设备来读取脑电信号,从而进一步降低成本。根据其特点,该设备与德州仪器生产的ADS1299设备的信噪比水平进行了比较,并在本文中用于比较。所提出的设备在满足信号中的噪音水平和检测伪影的准确性的基础上,还进行了测试,确认其能成功抵抗电磁干扰的影响,成功检测阿尔法脑波,并检测P300范式。
论文时间:12 Jul 2022
领域任务:Image Classification, Inductive Bias, 图像分类
论文地址:https://arxiv.org/abs/2207.05557
代码实现:https://github.com/hunto/lightvit
论文作者:Tao Huang, Lang Huang, Shan You, Fei Wang, Chen Qian, Chang Xu
论文简介:Vision transformers (ViTs) are usually considered to be less light-weight than convolutional neural networks (CNNs) due to the lack of inductive bias./视觉transformers(ViTs)通常被认为没有卷积神经网络(CNNs)轻量,因为缺乏归纳偏置。
论文摘要:视觉transformers(ViTs)通常被认为没有卷积神经网络(CNNs)轻量,因为缺乏归纳偏置。因此,最近的工作将卷积作为一种即插即用的模块,并将其嵌入到各种ViT的对应物中。在本文中,我们认为卷积核进行信息聚合以连接所有的标记;然而,如果这种明确的聚合能以更均匀的方式发挥作用,那么它们对于轻量级的ViTs来说实际上是不必要的。受此启发,我们提出了LightViT,作为一个新的轻量级ViT系列,在没有卷积的纯转化器块上实现更好的精度-效率平衡。具体来说,我们在ViTs的自我关注和前馈网络(FFN)中引入了一个全局而有效的聚合方案,其中引入了额外的可学习标记来捕捉全局依赖性;并对标记嵌入施加双维通道和空间关注。实验表明,我们的模型在图像分类、物体检测和语义分割任务上取得了重大改进。例如,我们的LightViT-T在ImageNet上仅用0.7G FLOPs就实现了78.7%的准确率,比PVTv2-B0高出8.2%,同时在GPU上快了11%。代码可在 https://github.com/hunto/LightViT 获取。
论文时间:7 Aug 2022
领域任务:3D Object Detection, object-detection,目标检测
论文地址:https://arxiv.org/abs/2208.03624
代码实现:https://github.com/nightmare-n/graphrcnn
论文作者:Honghui Yang, Zili Liu, Xiaopei Wu, Wenxiao Wang, Wei Qian, Xiaofei He, Deng Cai
论文简介:The dynamic farthest voxel sampling is then applied to evenly sample the points./然后应用动态最远体素取样来均匀地取样点。
论文摘要:两阶段检测器在三维物体检测中获得了很大的普及。大多数两阶段三维检测器在第二阶段利用网格点、体素网格或采样关键点进行RoI特征提取。然而,这类方法在处理分布不均和稀疏的室外点时效率很低。本文从三个方面解决了这个问题。1)动态点聚合。我们提出了补丁搜索,以快速搜索每个三维建议的局部区域内的点。然后应用动态最远体素抽样来对点进行均匀抽样。特别是,体素大小沿距离变化以适应点的不均匀分布。2)RoI-图形汇集。我们在采样点上建立局部图,以更好地模拟上下文信息,并通过迭代信息传递挖掘点的关系。3) 视觉特征增强。我们引入了一个简单而有效的融合策略来补偿语义线索有限的稀疏LiDAR点。基于这些模块,我们构建了图形R-CNN作为第二阶段,它可以应用于现有的单阶段检测器,以持续提高检测性能。广泛的实验表明,在KITTI和Waymo开放数据集上,Graph R-CNN以较大的优势胜过最先进的3D检测模型。而且我们在KITTI BEV汽车检测排行榜上排名第一。代码将在 https://github.com/Nightmare-n/GraphRCNN 发布。
我们是 ShowMeAI,致力于传播AI优质内容,分享行业解决方案,用知识加速每一次技术成长!点击查看 历史文章列表,在公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。点击 这里 回复关键字 日报 免费获取AI电子月刊与资料包。