以下是一些常见的数据可视化工具:
在实际应用中,选择工具应根据具体需求和项目特点来决定。例如,如果需要进行基础的数据可视化和详细的样式定制,Matplotlib 是不错的选择;若追求更美观和便捷的绘图方式,Seaborn 可能更合适;而对于需要创建交互式图表的场景,Plotly 则能发挥优势。
数据可视化(Matplotlib)基础绘图:plt.subplots():创建画布和坐标轴。ax.bar()绘制柱状图,ax.plot()绘制折线图。双Y轴:ax1.twinx():创建共享X轴的右侧Y轴。设置不同轴的颜色和标签:ax.set_ylabel(color='...')。样式调整:颜色(color)、透明度(alpha)、线型(linestyle)、线宽(linewidth)。图例合并:ax.legend([lines],[labels],loc='...')。日期优化:fig.autofmt_xdate(rotation=45):旋转日期标签。plt.tight_layout():自动调整子图间距。多子图布局:plt.subplots(4,1,sharex=True):创建4行1列的子图并共享X轴。时间序列分析移动平均滤波:rolling(window=3,center=True,min_periods=1).mean():滚动窗口计算移动平均。STL分解:STL(series,period=12):初始化STL分解模型。fit()方法拟合模型,提取趋势项(res.trend)和季节性项(res.seasonal)。
本实践课程为湖南大学刘泽楚编写[heading3]本实践材料[content]为了帮助编程初学者们更轻松地学习本文内容、上手实践项目,推荐使用豆包MarsCode编程助手获得技术支持,同时也可以使用豆包MarsCode助教寻求问题解答。豆包MarCode编程助手:豆包MarsCode助教:https://doubao.com/bot/ycPXsB5d数据集下载请点击链接:https://www.kaggle.com/c/titanic[heading3]本实验需要的语法基础[content]Python基础与环境配置Python语法基础:变量、数据类型、函数、模块导入(import)包管理工具:需通过pip安装pandas,seaborn,matplotlib库。开发环境:代码适合在Jupyter Notebook或IDE(如PyCharm,VS Code)中运行。数据处理基础(Pandas)读取数据:pd.read_csv()数据分组:groupby()计算分组元素数量:size()数据重塑:unstack()数据可视化(Matplotlib)创建画布和坐标轴:plt.subplots()绘制柱状图:plot(kind='bar')显示图例:plt.legend()显示图表:plt.show()
导入依赖库:MarsCode提示词:pandas:数据处理seaborn和matplotlib:数据可视化scikit-learn:加载内置数据集加载数据集:iris.data:特征数据(4列,共150条样本)iris.target:类别标签(0,1,2)[heading5]数据预处理[content]构建DataFrame:MarsCode提示词:将NumPy数组转换为Pandas DataFrame,添加特征名称新增target列存储类别标签标签映射:将数值标签(0/1/2)转换为可读的类别名称[heading5]数据可视化[content]设置绘图风格:whitegrid:启用白色背景与网格线,提升图表可读性。绘制小提琴图矩阵:参数说明:x='target':横轴为鸢尾花类别。y:纵轴为不同特征值。data=df:指定数据源。小提琴图解读:宽度表示数据分布密度,中间白点为中位数,黑色粗线为四分位范围(IQR)。图表美化:添加标题、坐标轴标签,并显示图表。