Python数据挖掘课程一安装P

一.大数据及数据挖掘基础

第一部分主要简单介绍三个问题:

1、什么是大数据?

2、什么是数据挖掘?

3、大数据和数据挖掘的区别?

1、大数据(BigData)

大数据(bigdata)指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。

下图是大数据经典的4V特征。

IBM大数据库框架及可视化技术,大数据常用:Hadoop、Spark,现在更多的是实时数据分析,包括淘宝、京东、附近美食等。

下图是大数据的一些应用

说到大数据,就不得不提Hadoop,而说到Hadoop,又不得不提Map-Reduce。

MapReduce是一个软件框架由上千个商用机器组成的大集群上,并以一种可靠的,具有容错能力的方式并行地处理上TB级别的海量数据集。MapReduce的思想是“分而治之”。Mapper负责“分,Reducer负责对map阶段的结果进行汇总。

2、数据挖掘(DataMining)

数据挖掘(DataMining):数据库、机器学习、人工智能、统计学的交叉学科。

数据挖掘需要发现有价值的知识,同时最顶端都是具有智慧的去发现知识及有价值的信息。

因为它主要是针对网页数据进行的大数据分析,需要WebMining分类如下:

Web挖掘主要分为三类:Web日志挖掘、Web内容挖掘、Web结构挖掘。

3、机器学习

讲到机器学习和数据挖掘相关的知识,通常都会补充两幅图片。很形象的表示了计算机智能化与人类传统知识的类比。

二.安装Python及基础知识

1、安装Python

在开始使用Python编程之前,需要介绍Python的安装过程。python解释器在Linux中可以内置使用安装,windows中需要去







































中科白癜风医院专家
国外治疗白癜风



转载请注明:http://www.xcqg58.com/zyyd/zyyd/8537.html

  • 上一篇文章:
  •   
  • 下一篇文章: 没有了