数据的搜集知识点一、数据的来源 ★从使用者的角度看统计数据资料的来源主要有两种渠道:原始或第一手统计数据通过直接的调查或实验获得的原始数据这是统计数据的直接来源。次级数据或第二手间接的统计数据①别人调查的数据并将这些数据进行加工和汇总后公布的数据②一切间接的统计数据都是从原始的第一手数据过渡而来的。一数据的直接来源–原始数据1.统计调查根据统计研究预定的目标、要求和任务运用科学的方法有计划、有组织地搜集客观实际资料的过程。通过统计调查得到的数据一般称为观测数据。2.实验法通过有意识地改变或控制某些输入变量观察其他输出变量的变化从而达到对事物本质或相互联系的认识。通过实验法得到的数据就是实验数据。【提示】搜集数据最基本的形式就是进行统计调查或进行实验活动统计调查或进行实验就是统计数据的直接来源。二数据的间接来源–次级数据次级数据(二手数据)是指由其他人搜集和整理得到的统计数据。限于一定的条件研究者可能无法亲自收集数据或者已知有些数据已有他人的调查成果不必再重新再做一次。这时就需要收集二手资料以满足研究的需要。这种建立在他人调查整理基础上的次级数据也称为数据的间接来源。常见的数据间接来源主要有:①公开出版的数据。②未公开发表的数据。③网络爬取的数据。例题【单选题】城镇居民家庭人均食品消费支出、城镇居民家庭人均可支配收入和食品类居民消费价格指数数据属于(B)。A.一手数据B.二手数据C.实验数据D.非数值型数据统计调查是根据调查的目的与要求运用科学的调查方法有计划、有组织地搜集统计数据资料的过程。调查方案一般包括调查目的和任务、调查对象和调查单位、调查方式、调查研究的内容、调查时间以及调查工作的组织实施计划等内容。(一)常用的统计调查方式(重点)☆1.普查是指为某一特定目的而专门组织的一次性的全面调查用来调查属于一定时点上或一定时期内的社会现象总量。它适于搜集某些不能或不适宜于定期的全面统计报表搜集的统计资料以摸清重大的国情、国力。例如我国第七次人口普查就是摸清我国2020年11月1日零时这个时点上全国人口总数等方面国情。普查的特点为:它是一种全面调查具有资料包括范围全面、详尽、系统的优点;它是一次性的专门调查准确性和标准化程度较高。因工作量大普查时间周期较长耗资也较多一般不宜经常举行。2.抽样调查抽样调查是一种非全面调查它是按照一定程序从总体中抽取一部分个体作为样本进行调查并根据样本调查结果来推断总体特征的数据调查方法。抽样调查是一种非全面的、一次性的或经常性的专门调查既能节省人力、物力、财力又可以提高资料的时效性而且能取得比较正确的全面统计资料具有许多优点是实际中应用最为广泛的一种调查方法。在实际抽样调查活动中比较关键的步骤是抽样。抽样方法主要有两种概率抽样和非概率抽样。(1)概率抽样也称随机抽样它是指遵循随机原则进行的抽样总体中每个单位都有一定的机会被选入样本。与非概率抽样相比概率抽样具有下列特点第一按照随机原则抽取样本。第二用样本统计量推断总体参数。第三可以计算并控制抽样误差的大小。调查的实践中经常采用的概率抽样方式有以下几种①简单随机抽样②分层抽样(类型抽样)它首先将要研究的总体按某种特征或某种规则划分为不同的层(组);然后按照等比例或最优比例的方式从每一层(组)中独立、随机地抽取个体;最后将各层的样本结合起来对总体的目标量进行估计。③整群抽样整群抽样是先将总体分为R个群或子总体然后按某种方式从中随机抽取r个群再对抽中的群中所有个体都进行调查的一种抽样方式。④系统抽样(等距抽样)它是将总体N个个体按某种顺序排列按规则确定个随机起点再每隔一定间隔逐个抽取样本单位的抽样方法。典型的系统抽样是先从数字1-k之间随机抽取一个数字r作为初始单位以后依次取rkr2k…。(2)非概率抽样不满足概率抽样要求的抽样都被归为非概率抽样。非概率抽样没有完全按照随机原则选取样本单位其中单个单位被选中的概率是不可知的样本统计量的分布不确定因而无法计算抽样误差也无法使用样本的结果对总体相应的参数进行推断。从理论上讲非概率抽样不能保证抽出来的个体对总体的代表性不能够由样本的特征准确地推断总体的特征但是由于该种方法简单、经济、便捷所以也是人们常用的方法。常用的非概率抽样方式有①方便抽样方便抽样也称为便利抽样、偶遇抽样。它主要用于初期评估的探索性研究。调查过程中由调查员依据方便的原则自行确定抽入样本的个体。如在实施问卷调查过程中访问员碰人即问或被调查者主动回答问题。方便抽样的优点是容易实施调查的成本低;缺点是样本的确定带有随意性样本无法代表有明确定义的总体。②判断抽样判断抽样是调查者根据主观经验和判断从总体中选取有代表性的个体构成样本的一种非概率抽样方法。它不能获得估计值的精度其精度取决于抽样者的经验适用于总体中的个体极不相同而样本容量又很小的情况。③配额抽样配额抽样类似于概率抽样中的分层抽样是非概率抽样方法中常用的一种抽样方法。其操作比较简单而且可以保证总体中不同类别的个体都能包括在所抽的样本中使得样本结构和总体结构类似。④雪球抽样雪球抽样也称为滚雪球抽样其原理是先找到最初的样本然后根据他们提供的信息去获得新的个体形成样本。这种过程不断继续直到完成规定的样本容量为止滚雪球抽样往往用于对稀少的特定群体的调查。3.统计报表是按照国家统一规定的调查要求与文件(指标、表格形式、计算方法等)自上而下地统一布置、自下而上地逐级提供基本统计资料的一种调查方式。按照报送范围1.全面报表要求调查对象中的每一个单位均要填报。2.非全面报表只要求一部分调查单位填报。按照报送周期统计报表主要有月报、季报、年报组成。月报内容简单、时效性强年报则内容比较全面。4.重点调查重点调查是在调查对象中选择一部分重点单位进行的一种非全面调查。重点调查的关键是准确恰当地选取重点样本。选取重点样本时一般采取系统分析、综合比较的方法选择对总体能起主要或决定作用的因素。这些重点单位虽然数目不多但它们具有所研究现象的总量在总体总量中占据绝大部分的特点。5.典型调查典型调查是一种非全面的专门调查它是根据调查的目的与要求在对被调查对象进行全面分析的基础上有意识地选择若干具有典型意义的或有代表性的被调查对象进行的调查。各类统计调查方法的特点例题【单选题】为了解房价上涨情况某课题组近日对北京、上海、广州和深圳的房价进行调查。这种调查属于(D)。A.普查B.抽样调查C.统计报表D.典型调查【单选题】为了解居民对“疏解整顿促提升”政策的态度调查者先将所有居民分成若干个社区然后从中随机抽取部分社区对选中社区内的所有居民进行调查。这种抽样方式是C。A.简单随机抽样B.分层抽样C.整群抽样D.系统抽样【单选题】下列抽样中属于非概率抽样的有(A)。A.在地铁口拦截行人回答问题B.使用随机数据表抽样C.使用计算机生成随机数抽样D.使用随机数骰子抽样【多选题】下列属于概率抽样的有(ABCD )。A.简单随机抽样B.分层抽样C.系统抽样D.整群抽样E.配额抽样二搜集数据的方法(了解)无论采用何种调查方式在取得数据时都需要使用些具体的搜集方法。这些方法归纳起来可分为询问(访谈)和观察实验两大类。1.询问(访谈)询问是调查者与被调查者直接或间接接触以获得数据的一种方法。常用的询问方法有(1)面访调查者与被调查者通过面对面地交谈可分为标准式访问(结构式访问)和非标准式访问(非结构式访问)两种市场调查和社会调查中常采用访问式调查。(2)邮寄也称邮寄问卷是一种标准化数据获取方式。调查者与被调查者没有直接的语言交流信息的传递依赖于所邮寄的问卷。(3)计算机辅助电话调查是一种计算机与电话相结合完成调查全过程的一种数据搜集方法。在进行数据搜集时调查问卷、答案都由计算机显示整个调查的过程包括电话拨号、调查记录、数据处理等。般需要借助专门的软件进行硬件设备要求较高。(4)座谈会也称集体访谈主要用于定性问题的研究参加座谈会的人数不宜过多一般为6-10人并且是有关调查问题的专家或有经验之人。(5)个别深入访谈(深访)次只有一名被调查者参加的特殊的调查方法常用于动机研究如消费者购买某种产品的动机等以发掘受访者非表面化的深层意见。该方法最适用于研究较为隐秘的问题如个人隐私或较敏感的问题如政治方面的问题。2.观察实验(1)观察法在一个真实或模拟的环境里调查对象完全没有意识到的情况下就调查对象的行动和意识调查人员边观察边记录以收集所需信息进行分析。它包括直接观察与间接观察。(2)实验法在事先确定调查的问题中选择影响这些问题的诸多因素中的一个或几个因素将其置于一定的条件下进行小规模实验的方法。如在推行某种经销方法前可先通过试点进行小规模的实验对实验结果进行分析研究再决定是否应该大规模推广。