- #!/usr/bin/env python3
- # -*- coding: utf-8 -*-
- # pylint: disable=W1401
- """
- Created on Mon Nov 6 21:04:24 2017
- @author: lu
- """
-
- import numpy as np
-
- import pandas as pd
- from sqlalchemy import create_engine
-
-
- """
- 这部分代码主要是用Python连接数据库,提取数据进行分析。
- 所j以在运行代码之前需要讲sql语句运行一遍将数据插入到mysql数据库中
- 注意这里需要提前创建一个database,并且在开头增加使用database的语句
- mysql -uroot -p < 7law.sql
- 需要等待一会
- 此部分代码没有运行,存在一定问题
- count107-->统计107类别情况
- programmer_1-->大概了解了处理数据意图
- programmer_2-->提取所需数据,并且保存到数据库中
- programmer_3-->进行数据筛选,保存到数据库中
- programmer_4-->合并某些特征为一个特征,保存到数据库
- programmer_5-->推荐矩阵
- """
-
-
- def count107(i):
- j = i[["fullURL"]][i["fullURLId"].str.contains("107")].copy()
- # 添加空列
- j["type"] = None
- # 利用正则进行匹配,并重命名
- j["type"][j["fullURL"].str.contains("info/.+?/")] = u"知识首页"
- j["ty