大家好,我是阿光。
本专栏整理了《PyTorch深度学习项目实战100例》,内包含了各种不同的深度学习项目,包含项目原理以及源码,每一个项目实例都附带有完整的代码+数据集。
正在更新中~ ✨
🚨 我的项目环境:
💥 项目专栏:【PyTorch深度学习项目实战100例】
本项目的目标是通过预测邮件信息是垃圾邮件还是垃圾邮件来构建垃圾邮件过滤器。这是一个经典的数据集,它来自于一个“单词包”模型,应用了惠普实验室收集的4601封电子邮件。这些特征包括在所有电子邮件信息训练中最常出现的57个单词和标点符号的相对频率。对于这个问题,并不是所有的错误都是一样的;错误分类垃圾邮件没有错误分类火腿那么糟糕!
这个数据集是从这里收集的。我只用了enron1文件夹。它包含两个文件夹的垃圾邮件和火腿。每个文件夹都包含电子邮件。我遍历了这些文件夹中的每个文本文件,创建了一个数据帧,并将其写入csv文件。这可能对其他人有帮助。