数据整理

更新时间:2023-11-17 21:08

数据整理是对调查、观察、实验等研究活动中所搜集到的资料进行检验、归类编码和数字编码的过程,它是数据统计分析的基础。数据整理是根据统计研究的任务和要求,对统计调查搜集到的大量原始资料进行审核、分组、汇总,使之条理化、系统化,得出能够反映总体综合特征的统计资料的工作过程;并且,对已经整理过的资料(包括历史资料)进行再加工也属于统计整理。

定义

在二十世纪90年代中晚期,为了揭示一些隐含数据性质、趋势和模式,很多商家开始探讨把传统的统计和人工智能分析技术应用到大型数据库的可行性问题,这些探讨最终发展成为基于统计分析技术的正规数据整理工具。

数据整理主要是指对原始数据进行加工处理,使之系统化、条理化,以符合统计分析的需要,同时用图表形式将数据展示出来,以便简化数据,使之更容易理解和分析。

方法

归纳法: 可应用直方图分组法层别法及统计解析法。

演绎法: 可应用要因分析图、散布图及相关回归分析

预防法: 通称管制图法,包括Pn管制图、P管制图、C管制图、U管制图、管制图、X-Rs管制图。

步骤

1.根据研究目的设计整理方案。

整理方案主要包括两个方面:一是对总体的处理方法,主要是考虑如何进行统计分组;二是确定反映总体特征的相关指标。

2.统计数据的审核与检查。

数据在整理以前,必须要对所获得的数据进行审核,检验原始数据的完整性、准确性和时效性。发现问题,要及时解决。

3.数据分组和汇总,并计算各项指标。

按照一定的标准将原始数据进行分组,汇总每一组的单位数,并计算诸如均值、方差等指标。

4.通过统计表或统计图,显示整理结果。

在统计分组的基础上,计算每组的频数,整理成频数分布表,绘制频数分布图

5.统计资料的积累、保管和公布。

统计资料的积累和保管。由于统计研究中要经常进行动态分析,这就需要长期积累统计资料。

意义

统计工作经过了统计调查阶段之后,搜集到了大量的统计资料,但所取得的统计资料主要是反映总体单位特征的原始资料,这些资料都是零星的、分散的、不系统的,只能表明各个被调查单位的具体情况,反映的是事物的表面现象,不能说明被研究总体的全貌,不能说明事物的本质特征,也无法揭示事物的发展规律。因此必须对这些调查资料进行加工和整理,以反映现象的总体特征。

数据整理是根据统计研究的任务和要求,对统计调查搜集到的大量原始资料进行审核、分组、汇总,使之条理化、系统化,得出能够反映总体综合特征的统计资料的工作过程。并且,对已经整理过的资料(包括历史资料)进行再加工也属于统计整理。通常,大量数据收集上来以后,并不能直接用来分析,因为这些数据间的差异仍能体现为一种原始的无序的状态,只有经过整理后我们才能找到现象的规律性。

数据整理是统计工作的中间环节,它是在统计调查的基础上进行的,又是统计调查的继续,同时又是统计调查的前提,在统计工作中起着承前启后的重要作用,在统计工作过程中具有十分重要的地位。统计整理结果的好坏,是否科学、真实地反映客观实际,将直接影响到统计分析的准确性,影响整个统计工作的质量。如果这一步工作搞不好,将会使调查来的丰富、完备的资料失去价值,从而不能达到统计工作的目的和完成统计工作的任务。

此外,数据整理还是积累历史资料的必要手段。统计研究中经常用到动态分析,这就需要长期积累的历史资料。而根据统计研究的需要,需要对已有的资料进行甄选、重新整理、分类和汇总等,都需要通过统计整理工作来完成。

注意事项

1.现场收集数据,应逐日、逐周和品管部门所收集的数据作核对,以求整理真实且具有代表性的数据。

2.数据整理,改善前、后所具备的条件要一致,如此所作的数据整理和比较才有意义。

3.异常发生要采取措施,一定要以整理后之数据为研究依据。

4.使用经别人发表的次级数据应注意:

(1)原搜集数据之目的与数据之来源如何?

(2)原使用之单位是否与所欲研究者一致,如不一致应如何调整始为合用?

(3)原来搜集所得之数字,可靠程度如何? 如可靠当然可以取用,不可靠时,应寻求原因,力谋解决。

(4)原来搜集方法如何? 有无重复或遗漏之处?

(5)如根据两种以上不同原始来源之数据,使用之前应查明其内容互异之处,寻求错误原因再定取舍。

数据整理技术

从商业角度来看,从前未知的统计分析模式或趋势的发现为企业提供了非常有价值的洞察力。数据整理技术能够为企业对未来的发展具有一定的预见性。数据整理技术可以分成3类:群集、分类和预测。

群集技术就是在无序的方式下集中信息。群集的一个例子就是对未知特点的群体商业客户的分析,对这一例子输入相关信息就可以很好的定义客户的特点。

分类技术就是指定object,以确定集合。集合通常用上面的技术来形成,可以举一个例子就是把客户按照他们的收入水平分成特定的销售群体。

预测技术就是对某些特定的对象和目录输入已知值,并且把这些值应用到另一个类似集合中以确定期望值或结果。比如,一组戴头盔和肩章的人是足球队的,那么我们也认为另一组带头盔和肩章的人也是足球队的。

免责声明
隐私政策
用户协议
目录 22
0{{catalogNumber[index]}}. {{item.title}}
{{item.title}}