码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • MLOps专栏文章汇总


    MLOps 技术栈架构

    MLOps stack architecture
    MLOps stack architecture

    MLOps

    • 全球的MLOps和ML工具概览
    • 聊聊MLOps是什么,它对算法工程师带来了什么
    • 可重复可复现的机器学习在生产中的12个要素
    • 软件工程大师 Martin Fowler 谈机器学习持续交付
    • 谷歌大佬谈 MLOps :机器学习中的持续交付和自动化流水线
    • 如何测试你的机器学习流水线?
    • 浅述MLOps的价值
    • AI 产业三大发展趋势(AutoML/MLOps/XAI)将加速企业 AI 应用落地
    • Algorithmia 首席执行官 Diego 谈从研发到人工智能的投资回报率
    • 机器学习模型在生产中表现不佳的5个原因
      • 为什么您的机器学习模型可能表现不佳(现实的变化-概念漂移(真实世界)、工程与数据科学迷失在转化中(应用接口)、应用程序更新(应用接口)、特征处理 Bug(内部数据流水线)、数据 Schema 变化(内部数据流水线))、使用指示器来检测模型的 常见问题(字段删除、类型不匹配、默认值更改、值超出范围、分布漂移、性能指标下降)
    • 如何将 MLOps 用于物联网和边缘设备(Valohai)
    • 降低模型输出风险的三种方法(Valohai)
    • Arize AI 对顶级 ML 团队调查得出的 3 个结论
      • 解决模型问题仍然太痛苦和缓慢(建议:评估并实现一个 ML 可观测性平台,帮助暴露和消除AI盲点。)、 ML 团队需要与业务主管更好地沟通(建议:提高内部可见性、提高 ML 读写能力并将模型指标与业务结果联系起来)、 可解释性很重要,但它不是一切(建议:不要仅仅依靠可解释性;采取积极主动的方法进行模型性能管理。)
    • 识别人工智能用户场景---一种规格并不适用于所有场景(Noogata)
    • 如何规模化企业人工智能(Noogata)

    无代码与以数据为中心的 AI 平台

    • 无代码 AI 和 MLOps:无代码 AI 仅用于不会代码的终端用户(Valohai)
    • 以数据为中心的人工智能应该如何实施(Valohai)
    • 数据优先的人工智能会是下一个颠覆性的大事件吗?(Continual)
    • 无代码 AI 概览(Levity)
    • 无代码人工智能:它是什么,它为什么重要?(Noogata)
    • 我们为什么创建无代码 AI 平台 Noogata
    • 无代码人工智能平台:成功的基石(Noogata)
    • 无代码 AI 工具的类型(NoCode.ai)
    • 无代码平台如何为中小型企业带来人工智能
    • DLOps:用于深度学习的 MLOps(Valohai)

    数据版本管理

    捕获数据版本以重现、跟踪和记录您的 ML 模型血缘。

    • 用于 MLOps 的最佳数据版本控制工具(Aporia)
    • 数据科学家 Emily Gorcenski 谈数据版本控制(CD4ML)

    DVC

    • DVC 官网教程-中文版

    特征存储

    • 现代数据团队的特征工程(Continual)
    • 现代数据栈的未来(Continual)
    • 特征平台(Feature Store):您需要知道的关于特征平台的一切信息(Continuous)
    • 用于 MLOps 的最佳特征平台(Aporia)

    AutoML

    NNI

    • 浅析自动机器学习(AutoML)工具NNI

    模型实验跟踪

    跟踪有关实验的重要信息,如参数、指标和模型。

    MLflow

    • 浅谈机器学习生命周期平台MLflow
    • MLflow 快速入门

    机器学习流水线(Pipeline)

    自动化ML实验的步骤。调度流水线运行,以根据新数据重新训练模型。

    • 开源机器学习流水线工具调研(MLOps)
    • 正向数据工程和逆向数据工程(Prefect工作流)
    • 开源机器学习工作流Ploomber
    • 五分钟快速了解Airflow工作流
    • 浅析数据工作流Prefect
    • 浅析机器学习工作流Kubflow Pipelines
    • 如何将 Apache Airflow 用于机器学习工作流
    • Kubeflow 和 Argo 的综合比较
    • 用于 MLOps 的最佳训练编排工具(Aporia)

    模型可视化

    • 如何将模型可视化工具Netron改造为通用的WEB服务(Flask)?
    • 机器学习模型可视化类型和工具
    • 可视化机器学习实验指标和超参数的最佳工具(Neptune)
    • 机器学习模型可视化:指南和工具(Neptune)
    • 机器学习模型可视化的最佳工具(Neptune)

    模型服务

    创建API端点并使用模型进行预测。

    • 浅析云原生模型推理服务框架KServe
    • 在线推理是否会导致您的白发?

    BentoML

    • 快速入门统一模型部署(Model Serving)框架 BentoML
    • BentoML核心概念(一):服务定义
    • BentoML核心概念(二):API 和 IO 描述符
    • BentoML核心概念(三):构建Bentos
    • BentoML核心概念(四):模型和 Bento 管理

    Seldon

    • 使用 Seldon Core 服务模型
      • 什么是模型服务(通过 API 与您的模型交互、将模型部署到云端或边缘设备、轻松扩展模型以满足用户需求)、Seldon Core简介、Seldon Core 安装、Seldon 如何为模型服务、使用自定义 Docker 镜像服务、Seldon 适合你吗
    • 使用 Seldon Alibi 进行模型监控
      • 模型监控如何工作(数据漂移、异常值、偏见)、Alibi Detect 简介、监控模型(部署图像分类器、部署漂移检测器)、从 Alibi 中获取指标、Alibi 适合你吗?

    可解释机器学习

    • Umang 谈部署可解释机器学习面临的挑战
    • 机器学习模型可解释性实践指南(Aporia)
    • ML 模型解释工具:模型解释是什么、为什么需要模型解释以及如何解释模型

    模型监控

    • 机器学习可观察性 VS 机器学习监控(Aporia)
    • 如何理解机器学习中的偏见和公平(Aporia)
    • 如何监控你的 ML 流水线
    • 特定领域的机器学习监控
    • 机器学习模型监控的 9 个技巧
    • 监控模型在生产环境的性能(Arize)
    • 可解释的监控:停止盲目行动并监控您的 AI
    • 评估ML监控解决方案时要避免的常见陷阱(mona)
    • ML 模型再训练无法解决的问题(mona)
    • 监控生产环境中的机器学习模型

    模型监控概述

    • 什么是模型监控?(Valohai)
      • 为什么要监控模型、 机器学习模型监控清单(数据分布变化、性能改变、健康指标/运营指标、数据完整性、分段性能、偏见/公平)、在 Valohai 中如何监控模型(存储指标、在 UI 中可视化指标)
    • 机器学习模型监控清单
      • 服务健康、数据质量和完整性、数据和目标漂移、模型性能、分段性能表现、偏见/公平、异常值
    • 模型监控:定义、重要性和最佳实践(AI Multiple)
      • 什么是模型监控、为什么模型监控很重要、ML 模型随时间退化的原因(不断变化的环境、更改业务数据)、 模型监控变量(真实值与预测值检查、数据分布变化、无错误数据、公平、运行指标)
    • 机器学习模型监控(Aporia)
      • 机器学习模型监控(什么是模型监控、 如何监控机器学习(数据漂移检测、数据完整性检测、概念漂移检测、数据偏差、异常))、 模型中的漂移检测(模型漂移、数据漂移(KS检验、PSI、Z-score)、概念漂移)、 机器学习性能监控(如何监控机器学习性能、如何提高模型性能)、机器学习模型管理、模型可解释性、机器学习实验跟踪、机器学习模型注册表
    • MLOps:模型监控
      • 模型监控背景、模型监控动机、 模型监控指标(稳定性指标、性能表现指标、运营指标)
    • 监控生产中的ML系统,您应该跟踪哪些指标?
      • 为什么需要ML监控、ML监控动机、模型监控金字塔(软件后端、数据、ML模型、业务或产品KPI)、 模型监控指标(ML系统健康监测、ML数据质量监控、ML模型质量监控、业务指标和KPI)、模型监控利益相关者、 模型监控难点

    模型漂移

    • 机器学习中的概念漂移(Aporia)
      • 机器学习中的 漂移类型(概念漂移、预测漂移、标签漂移、特征漂移)、 概念漂移可以以不同的方式出现(突然漂移、逐渐漂移、递增的漂移、重复出现的概念)、 概念漂移的两种类型(虚拟的漂移、真正的漂移)、现实生活中的概念漂移、概念漂移的难点
    • 机器学习概念漂移检测方法(Aporia)
      • 统计方法(JS散度、KL散度、KS检验)、 统计过程控制方法(DDM/EDDM、CUMSUM及其变体PH)、 时间窗口分布方法(ADWIN、Paired Learners)、 上下文方法(树特征)、漂移检测实现工具
    • 如何检测和克服MLOps中的模型漂移
      • 模型漂移的类型(概念漂移、数据漂移)、 解决模型漂移、创建可持续的机器学习模型
    • 数据漂移、概念漂移以及如何监控它们(mona)
      • 什么是数据漂移、什么是概念漂移、 数据漂移和概念漂移的区别、什么时候应该关注概念漂移、 监控数据漂移和概念漂移的建议

    模型监控数据类型

    • 如何检测文本(NLP)和图像(计算机视觉)数据漂移
      • 四种不同类型的实时监测技术来 检测和减少模型漂移(数据质量、模型质量、模型偏差、模型可解释性)、NLP 数据漂移(协变量漂移、标签漂移、概念漂移、 模型监控方法)、图像数据漂移( 模型监控方法)
    • 使用 Arize 监控非结构化数据(Arize)
      • 为什么要 Embeddings、Arize 发布 Embeddings 的支持、使用 Arize 的示例工作流程
    • 数据漂移检测(一):使用表格数据的多变量漂移(Arthur)
      • 单变量漂移检测( 测量现在通过模型的数据与 训练集之间的分布相似性)、多变量漂移检测( 我们必须考虑数据的高维联合分布,将 多维辅助模型拟合到 训练集的完整联合分布)
    • 数据漂移检测(二):NLP 和 CV 中的非结构化数据(Arthur)
      • 非结构化数据漂移检测方法、概述(向量表示、密度模型、评分)、评估

    模型监控工具

    • ML 模型监控最佳工具
      • 如何比较 ML 模型监控工具(易于集成、灵活性和表现力、开销、监控功能、警报)、 ML 模型监控工具(Neptune、Arize、WhyLabs、Grafana+Prometheus、 Evidently(开源)、Qualdo、Fiddler、Amazon SageMaker Model Monitor、 Seldon Alibi Detect(开源)、Censius)
    • 一个精选的模型监控工具列表
      • Aporia、 Deepchecks(开源)、MLRun、 Evidently(开源)、WhyLabs
    • 机器学习模型监控工具:Evidently 与 Seldon Alibi 对比
      • 比较标准(兼容性、集成、能力) 、Evidently( 离线分析、实时监控)、Seldon Alibi Detect( 离线分析、实时监控)

    Evidently

    • 如何检测、评估和可视化数据中的历史漂移(Evidently)
    • 如何在 20 天内损坏一个模型? 一个生产环境模型分析教程(Evidently)
    • 你的模型隐藏了什么? 一个评估 ML 模型的教程(Evidently)

    Seldon Alibi Detect

    • 在 IMDB 电影评论数据集上进行文本数据漂移检测(Seldon Alibi Detect)
      • 加载 数据集/Tokenizer、预处理、 KS检验、 MMD(TensorFlow/PyTorch)、 从头开始训练的模型中的 embeddings(TensorFlow)
    • 在 CIFAR-10 数据集上使用最大均值差异(MMD)漂移检测器(Seldon Alibi Detect)
    • 在 CIFAR-10 数据集上使用 Kolmogorov Smirnov 数据漂移检测器(Seldon Alibi Detect)

    人工智能系统(AI System)

    • 人工智能系统(一):概述
    • 人工智能系统(二):技术栈

    向量数据库

    • 云原生向量数据库Milvus(一)-简述、系统架构及应用场景
    • 云原生向量数据库Milvus(二)-数据与索引的处理流程、索引类型及Schema
  • 相关阅读:
    【OJ比赛日历】快周末了,不来一场比赛吗? #11.11-11.17 #12场
    Linux centos 卸载 ceph
    无涯教程-Android - List fragments函数
    万字血书Vue—Vue语法
    8+单基因+细胞凋亡+WGCNA+单细胞+实验验证
    【实践篇】redis管道pipeline使用详解
    Nginx监控模块
    《程序员的职业素养》读书笔记万字总结【建议收藏】
    C# netcore 创建WebService(SoapCore)
    【6.824】分布式lab1 mapReduce
  • 原文地址:https://blog.csdn.net/scgaliguodong123_/article/details/127583412
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号