ShowMeAI日报系列全新升级!覆盖AI人工智能 工具&框架 | 项目&代码 | 博文&分享 | 数据&资源 | 研究&论文 等方向。点击查看 历史文章列表,在公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。点击 这里 回复关键字 日报 免费获取AI电子月刊与资料包。
https://www.toutiao.com/article/7132843699951632937
脉脉本周发布《2022人工智能顶尖人才数据图鉴》。数据显示,科技大厂仍是人工智能招聘主力,小巨头Shopee、小红书人工智能招聘需求增长最快,杭州的人工智能人才数是上海深圳的总和,传统互联网正在为人工智能造血——多个岗位均能转向数据科学家 ,自动驾驶领域岗位需求有巨大缺口。
新一轮人才流动已经开始,互联网的行业光环逐渐消失,人工智能的崛起为技术人才带来新的职业红利期。从互联网到以人工智能为代表的新兴行业,成为可以预见的人才迁徙必经之路。(公众号『ShowMeAI研究中心』回复『日报』,获取PDF高清文件)
https://github.com/maxent-ai/ocrpy
OcrPy 是一个 OCR 强大工具,可以帮助用户轻松地对任何文件进行 OCR(光学文字识别)、归档、索引和搜索,它包含简单直观的界面和一个强大的管道 API。Ocrpy 内置各种 OCR 引擎,如 Tesseract OCR、Aws Textract、Google Cloud Vision 和 Azure Computer Vision,统一了由各种云工具和其他开源库提供的众多接口,并为用户提供了一个简单、易于使用的界面。
https://github.com/smartxworks/sunmao-ui
Sunmao (榫卯)是一个前端低代码框架。通过 Sunmao,您可以轻松将各种前端 UI 组件库和自己开发的前端组件,封装成低代码组件库,从而搭建您自己的低代码 UI 开发工具,使前端开发变得如榫卯般严丝合缝。
https://github.com/sgsellan/gpytoolbox
gpytoolbox 是一个工具箱,包含用Python制作几何图形处理研究原型的实用函数集合。
https://github.com/balbasty/nitorch
NITorch 是一个用 PyTorch 编写的库,旨在进行医学图像处理和分析,重点是神经影像学。它是一个多功能的软件包,为深度学习和基于优化的算法实现了低级工具和高级算法。它实现了低级别的可微分函数、层、骨干、优化器,但也实现了注册和逆向问题的高级算法,以及一套用于操作医学图像的命令行工具。
https://github.com/kenjihiranabe/The-Art-of-Linear-Algebra
作者尝试对『适用于所有人的线性代数』中介绍的重要概念进行直观的可视化,从矩阵分解的角度促进对向量/矩阵计算和算法的理解,包括列行 (Column-Row CR)、高斯消除 (Gaussian Elimination LU)、Gram-Schmidt 正交化 (QR)、特征值和对角化 (Q \Lambda Q^T) 和奇异值分解 (U \Sigma V^T)。
https://github.com/mli/paper-reading
视频也在B站和知乎更新。论文选取的原则是10年内深度学习里有影响力文章(必读文章),或者近期比较有意思的文章。
https://github.com/yolofeng/CVPR2022-Autonomous-Driving
资源合辑包含以下部分:
可以点击 这里 回复关键字日报,免费获取整理好的论文合辑。
科研进展
- 2022.08.11 『数据扩增』Towards Sequence-Level Training for Visual Tracking
- 2022.08.07 『量子物理』Artificial Intelligence and Machine Learning for Quantum Technologies
- 2022.07.02 『机器学习』DPM-Solver: A Fast ODE Solver for Diffusion Probabilistic Model Sampling in Around 10 Steps
- 2022.08.04 『计算机视觉』Vision-Centric BEV Perception: A Survey
论文时间:11 Aug 2022
领域任务:Data Augmentation, reinforcement-learning, 数据扩增,强化学习
论文地址:https://arxiv.org/abs/2208.05810
代码实现:https://github.com/byminji/SLTtrack
论文作者:Minji Kim, Seungkwan Lee, Jungseul Ok, Bohyung Han, Minsu Cho
论文简介:Despite the extensive adoption of machine learning on the task of visual object tracking, recent learning-based approaches have largely overlooked the fact that visual tracking is a sequence-level task in its nature; they rely heavily on frame-level training, which inevitably induces inconsistency between training and testing in terms of both data distributions and task objectives./尽管机器学习在视觉物体跟踪任务上被广泛采用,但最近基于学习的方法在很大程度上忽略了一个事实,即视觉跟踪在本质上是一个序列级的任务;它们严重依赖帧级训练,这不可避免地在数据分布和任务目标方面引起了训练和测试的不一致。
论文摘要:尽管机器学习在视觉物体跟踪任务中被广泛采用,但最近基于学习的方法在很大程度上忽略了一个事实,即视觉跟踪在本质上是一个序列级的任务;它们严重依赖帧级训练,这不可避免地引起了训练和测试在数据分布和任务目标方面的不一致。这项工作介绍了一种基于强化学习的视觉跟踪的序列级训练策略,并讨论了数据采样、学习目标和数据增强的序列级设计如何能够提高跟踪算法的准确性和鲁棒性。我们在包括LaSOT、TrackingNet和GOT-10k在内的标准基准上的实验表明,四个有代表性的跟踪模型,SiamRPN++、SiamAttn、TransT和TrDiMP,通过在训练中加入所提出的方法,在不修改架构的情况下,持续地提高。
论文时间:7 Aug 2022
领域任务:Quantum Physics (quant-ph),量子物理
论文地址:https://arxiv.org/abs/2208.03836
代码实现:https://github.com/ml4qtech/collection
论文作者:Mario Krenn, Jonas Landgraf, Thomas Foesel, Florian Marquardt
论文简介:In recent years, the dramatic progress in machine learning has begun to impact many areas of science and technology significantly./近年来,机器学习的巨大进步已经开始对许多科技领域产生重大影响。
论文摘要:近年来,机器学习的巨大进步已经开始对许多科学和技术领域产生重大影响。在本篇文章中,我们探讨了量子技术是如何从这场革命中受益的。我们在说明性的例子中展示了科学家们在过去几年中如何开始使用机器学习和更广泛的人工智能方法来分析量子测量,估计量子设备的参数,发现新的量子实验设置、协议和反馈策略,并普遍改善量子计算、量子通信和量子模拟的各个方面。我们讲到了开放的挑战和未来的可能性,并以对未来十年的一些推测性愿景作为结束。
论文时间:2 Jun 2022
领域任务:机器学习
论文地址:https://arxiv.org/abs/2206.00927
代码实现:https://github.com/luchengthu/dpm-solver,https://github.com/crowsonkb/k-diffusion
论文作者:Cheng Lu, Yuhao Zhou, Fan Bao, Jianfei Chen, Chongxuan Li, Jun Zhu
论文简介:In this work, we propose an exact formulation of the solution of diffusion ODEs./在这项工作中,我们提出了扩散ODEs解决方案的精确表述。
论文摘要:扩散概率模型(DPMs)是新兴的强大生成模型。尽管它们具有高质量的生成性能,但DPMs仍然受到缓慢采样的影响,因为它们通常需要对大型神经网络进行数百或数千次的连续函数评估(步骤)才能得出一个样本。从DPM中取样可以被看作是解决相应的扩散常微分方程(ODEs)。在这项工作中,我们提出了一个解决扩散ODEs的精确公式。该公式显式地计算了解决方案的线性部分,而不是像以前的工作那样留给黑盒ODE求解器。通过应用变量的变化,解决方案可以等效地简化为神经网络的指数加权积分。基于我们的表述,我们提出了DPM-Solver,这是一个快速的专用于扩散ODE的高阶求解器,具有收敛顺序保证。DPM-Solver适用于离散时间和连续时间的DPMs,无需进一步训练。实验结果表明,DPM-Solver在各种数据集上只需进行10到20次函数评估就能生成高质量的样本。在CIFAR10数据集上,我们在10次函数评估中实现了4.70个FID,在20次函数评估中实现了2.87个FID,与之前最先进的免训练采样器相比,在各种数据集上的速度提高了4∼16倍。
论文标题:Vision-Centric BEV Perception: A Survey
论文时间:4 Aug 2022
领域任务:计算机视觉
论文地址:https://arxiv.org/abs/2208.02797
代码实现:https://github.com/4dvlab/vision-centric-bev-perception
论文作者:Yuexin Ma, Tai Wang, Xuyang Bai, Huitong Yang, Yuenan Hou, Yaming Wang, Yu Qiao, Ruigang Yang, Dinesh Manocha, Xinge Zhu
论文简介:To stimulate its future research, this paper presents a comprehensive survey of recent progress of vision-centric BEV perception and its extensions./为了刺激其未来的研究,本文对以视觉为中心的BEV感知及其扩展的最新进展进行了全面调查。
论文摘要:以视觉为中心的BEV感知由于其固有的优点,包括呈现世界的自然表征和对融合友好,最近受到工业界和学术界越来越多的关注。随着深度学习的快速发展,人们提出了许多方法来解决以视觉为中心的BEV感知问题。然而,对于这个新的和不断增长的研究领域,还没有最新的综述调研。为了促进其未来的研究,本文对以视觉为中心的BEV感知及其扩展的最新进展进行了全面的调查。它收集和整理了最近的知识,并对常用的算法进行了系统的回顾和总结。它还提供了对几个BEV感知任务的深入分析和比较结果,促进了对未来工作的比较并激发了未来的研究方向。此外,还讨论了经验性的实现细节,并显示出对相关算法的发展有所帮助。
我们是 ShowMeAI,致力于传播AI优质内容,分享行业解决方案,用知识加速每一次技术成长!点击查看 历史文章列表,在公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。点击 这里 回复关键字 日报 免费获取AI电子月刊与资料包。