博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《Python数据分析与挖掘实战》一第3章 数 据 探 索
阅读量:5876 次
发布时间:2019-06-19

本文共 321 字,大约阅读时间需要 1 分钟。

本节书摘来自华章出版社《Python数据分析与挖掘实战》一书中的第3章,作者 张良均 王路 谭立云 苏剑林,更多章节内容可以访问云栖社区“华章计算机”公众号查看

第3章

数 据 探 索

根据观测、调查收集到初步的样本数据集后,接下来要考虑的问题是:样本数据集的数量和质量是否满足模型构建的要求?是否出现从未设想过的数据状态?其中有没有什么明显的规律和趋势?各因素之间有什么样的关联性?
通过检验数据集的数据质量、绘制图表、计算某些特征量等手段,对样本数据集的结构和规律进行分析的过程就是数据探索。数据探索有助于选择合适的数据预处理和建模方法,甚至可以完成一些通常由数据挖掘解决的问题。
本章从数据质量分析和数据特征分析两个角度对数据进行探索。

转载地址:http://tsenx.baihongyu.com/

你可能感兴趣的文章
连接数据库超时设置autoReconnect=true
查看>>
虚拟机Centos7连接Internet
查看>>
ansible 基本操作(初试)
查看>>
更改tomcat的根目录路径
查看>>
51nod 1292 字符串中的最大值V2(后缀自动机)
查看>>
加快ALTER TABLE 操作速度
查看>>
Python多线程学习(上)
查看>>
学习笔记之软考数据库系统工程师教程(第一版)
查看>>
基本网络概念
查看>>
将 ASP.NET Core 2.0 项目升级至 ASP.NET Core 2.1 RC 1
查看>>
2018-2019 20165208 网络对抗 Exp8 Web基础
查看>>
Mac出现程序闪退的解决方案
查看>>
OKR学习总结
查看>>
一个我自己建的程序员资料分享站
查看>>
学习面向对象思想,开始考虑通过封装、 继承、多态把程序的耦合度降低
查看>>
codeforces 796A Buying A House
查看>>
《精通Spring 4.x 企业应用开发实战》读书笔记
查看>>
5月8日——iOS中的3D Touch效果
查看>>
Mongodb笔记(三)user && aggregate && mapReduce
查看>>
ubuntu中安装apache ab命令进行简单压力测试
查看>>