• 咖啡价格分析


    一、数据概览

    咖啡是一种用烘焙过的咖啡豆、咖啡属某些开花植物的浆果种子调制而成的饮料。 从咖啡果实中分离出种子,生产出一种稳定的、未经烘焙的生咖啡。 然后将种子进行烘焙,这一过程将它们转化为一种可消费的产品:焙烤咖啡,将其磨成细颗粒,通常在热水中浸泡,然后过滤,形成一杯咖啡。

    咖啡价格数据从2000年1月2022年5月。

    在本例中我们使用pandas、pyplot、seaborn进行数据可视化,绘制折线图、柱状图、散点图,我们可以观察1、日、月、季度、年 咖啡价格,Open-High-Low-Close-Vol每日咖啡价格,Open\High\Low\Close\Vol,Low-Close,High-Close,Open-Close关系。

    plt.plot() kind的参数:

    1. "area"用于面积图。
    2. "bar"用于垂直条形图。
    3. "barh"用于水平条形图。
    4. "box"用于箱形图。
    5. "hexbin"用于六边形图。
    6. "hist"用于直方图。
    7. "kde"用于核密度估计图。
    8. "density"是"kde"的别名。
    9. "line"用于折线图。
    10. "pie"用于饼图。
    11. "scatter"用于散点图

    二、数据预处理

    1. import pandas as pd
    2. df = pd.read_csv('./data/coffee.csv')
    3. # df.info()
    4. # print(df.shape) # (5671, 7)
    5. # print(df.describe())
    6. # print(df.columns) #Index(['Date', 'Open', 'High', 'Low', 'Close', 'Volume', 'Currency'], dtype='object')
    7. # print(len(df.Date.unique())) #5671
    8. # print(df.Currency.unique()) #['USD']

    三、数据可视化

    1. import pandas as pd
    2. import matplotlib.pyplot as plt
    3. import seaborn as sns
    4. plt.rcParams['font.sans-serif'] = ['SimHei'] # 显示中文标签
    5. plt.rcParams['axes.unicode_minus'] = False
    6. df = pd.read_csv('./data/coffee.csv')
    7. df.Date = pd.to_datetime(df.Date, yearfirst=True)
    8. df.set_index('Date', inplace=True)

    1、日、月、季度、年 咖啡价格

    1. fig, axes = plt.subplots(2, 2, figsize=[15, 7])
    2. fig.suptitle('咖啡价格', size=24)
    3. # 每天的价格
    4. axes[0, 0].plot(df.Close.resample('D').mean())
    5. axes[0, 0].set_title("日", size=16)
    6. # 每个月的价格
    7. axes[0, 1].plot(df.Close.resample('M').mean())
    8. axes[0, 1].set_title("月", size=16)
    9. # 每个季度的价格
    10. axes[1, 0].plot(df.Close.resample('Q').mean())
    11. axes[1, 0].set_title('季度', size=16)
    12. # 每年的价格
    13. axes[1, 1].plot(df.Close.resample('A').mean())
    14. axes[1, 1].set_title('年', size=16)
    15. plt.tight_layout()
    16. plt.show()

    2、Open-High-Low-Close-Vol每日咖啡价格

    1. df["Vol"] = df["Volume"] / 100
    2. df["Open"].plot(label="Open", color="#00A505", linewidth=1, figsize=(15, 5))
    3. df["High"].plot(label="High", color="#F54974", linewidth=1, figsize=(15, 5))
    4. df["Low"].plot(label="Low", color="#E8C0FD", linewidth=1, figsize=(15, 5))
    5. df["Close"].plot(label="Close", color="#1CACDB", linewidth=0.75, figsize=(15, 5))
    6. df["Vol"].plot(label="Volume", color="#0000C0", alpha=0.55, linewidth=0.75, figsize=(15, 5))
    7. plt.grid(axis="y", color="#000000")
    8. plt.title("Open-High-Low-Close-Vol每日咖啡价格")
    9. plt.xlabel("年")
    10. plt.ylabel("USD")
    11. plt.legend(loc=2)
    12. plt.savefig(r'.\result\Open-High-Low-Close-Vol每日咖啡价格.png')
    13. plt.show()

    3、Open\High\Low\Close\Vol

    1. def sns_displotbins(df, x, bins):
    2. sns.displot(df, x=x, bins=bins)
    3. plt.title(x)
    4. plt.tight_layout()
    5. plt.show()
    6. def sns_displot(df, x):
    7. sns.displot(df, x=x)
    8. plt.title(x)
    9. plt.tight_layout()
    10. plt.show()
    11. sns_displotbins(df, 'Open', 10)
    12. # sns_displotbins(df, 'High', 10)
    13. # sns_displotbins(df, 'Low', 10)
    14. # sns_displotbins(df, 'Close', 10)
    15. # sns_displotbins(df, 'Volume', 10)
    16. sns_displot(df, 'Open')
    17. # sns_displot(df, 'High')
    18. # sns_displot(df, 'Low')
    19. # sns_displot(df, 'Close')
    20. # sns_displot(df, 'Volume')

    4、Low-Close,High-Close,Open-Close关系

    1. df.plot(x="Low", y="Close", kind="scatter", color="#1CD89D", alpha=0.3) # 散点图
    2. plt.xlabel("Low")
    3. plt.ylabel("Close")
    4. plt.show()
    5. df.plot(x="High", y="Close", kind="scatter", color="#0ABF04", alpha=0.5) # 核密度估计图
    6. plt.xlabel("High")
    7. plt.ylabel("Close")
    8. plt.show()
    9. df.plot(x="Open", y="Close", kind='scatter', color="#ED5894", alpha=0.5) # 折线图
    10. plt.xlabel("Open")
    11. plt.ylabel("Close")
    12. plt.show()

  • 相关阅读:
    【Linux】环境基础开发工具使用
    JS 字符串转 GBK 编码超精简实现
    ssm+jsp黄梅戏曲艺剧团管理系统
    导航系统架构及业务模块组合策略
    【★★★★★ 第8章 排序 2022 9.10】
    【计算机网络知识】TLS/SSL的工作原理和HTTPS的优缺点
    Dapr 的 gRPC组件(又叫可插拔组件)的提案
    指针笔试题(帮助你全面理解指针!!!)
    开源与闭源:驾驭大模型未来的关键决断
    攻防世界流量分析1
  • 原文地址:https://blog.csdn.net/c_lanxiaofang/article/details/126575401