为了解某地区企业信息化发展水平,从该地区中随机抽取50家企业调研,针对体现企业信息化发展水平的A和B两项指标进行评估,获得了它们的成绩(十分制),并对数据(成绩)进行整理、描述和分析.下面给出了部分信息.
a.A项指标成绩的频数分布直方图如下(数据分成6组:,,,,,):
b.A项指标成绩在这一组的是:
7.2 7.3 7.5 7.67 7.7 7.71 7.75 7.82 7.86 7.9 7.92 7.93 7.97
c.两项指标成绩的平均数、中位数、众数如下:
平均数 | 中位数 | 众数 | |
A项指标成绩 | 7.37 | m | 8.2 |
B项指标成绩 | 7.21 | 7.3 | 8 |
根据以上信息,回答下列问题:
(1)写出表中m的值
(2)在此次调研评估中,某企业A项指标成绩和B项指标成绩都是7.5分,该企业成绩排名更靠前的指标是______________(填“A”或“B”),理由是_____________;
(3)如果该地区有500家企业,估计A项指标成绩超过7.68分的企业数量.
(1)7.84;(2)B,见解析(3)290
【分析】
(1)根据中位数定义,先把50名企业A项指标成绩排序,而中位数就是第25,26两项数据的平均数,易得(7.82+7.86)÷ 2 =7.84,即求出m的值;
(2)结合两项指标成绩的平均数、中位数、众数综合评判:该企业A项指标成绩是7.5分,小于A项指标成绩的中位数,说明该企业A项指标成绩的排名在后25名;B项指标成绩是7.5分,大于B项指标成绩的中位数,说明该企业B项指标成绩的排名在前25名,故让该企业成绩排名更靠前的指标是B.
(3)先根据样本数据计算出样本中A项指标成绩超过7.68分的企业数量,再表示这部分在样本中的占比为,再用该地区的企业总数乘以,即可估算出该地区A项指标成绩超过7.68分的企业数量.
【详解】
解:(1)根据中位数的定义,把50名企业A项指标成绩排序,
可得第25,26两项数据分别是7.82 和 7.86,
∴中位数为(7.82+7.86)÷ 2 =7.84
故m = 7.84.
(2)在此次调研评估中,该企业成绩排名更靠前的指标是B.
理由:该企业A项指标成绩是7.5分,小于A项指标成绩的中位数,说明该企业A项指标成绩的排名在后25名;B项指标成绩是7.5分,大于B项指标成绩的中位数,说明该企业B项指标成绩的排名在前25名.
(3)根据题意可知,在样本中,由(1)排序知,A项指标成绩在这一组,A项指标成绩超过7.68分的企业数量是9,A项指标成绩在这一组的数量是17,A项指标成绩在这一组的数量是3
∴9+17+3=29,
∴估计该地区A项指标成绩超过7.68分的企业数量为.
【点睛】
本题主要考查了用样本数据估算总体,中位数的计算等知识,难度不大;准确掌握中位数及用样本数据估算总体的方法,是解决本题的关键.
平均数、中位数和众数异同:
一、相同点
平均数、中位数和众数这三个统计量的相同之处主要表现在:都是来描述数据集中趋势的统计量;都可用来反映数据的一般水平;都可用来作为一组数据的代表。
二、不同点
它们之间的区别,主要表现在以下方面。
1、定义不同
平均数:一组数据的总和除以这组数据个数所得到的商叫这组数据的平均数。
中位数:将一组数据按大小顺序排列,处在最中间位置的一个数叫做这组数据的中位数 。
众数:在一组数据中出现次数最多的数叫做这组数据的众数。
2、求法不同
平均数:用所有数据相加的总和除以数据的个数,需要计算才得求出。
中位数:将数据按照从小到大或从大到小的顺序排列,如果数据个数是奇数,则处于最中间位置的数就是这组数据的中位数;如果数据的个数是偶数,则中间两个数据的平均数是这组数据的中位数。它的求出不需或只需简单的计算。
众数:一组数据中出现次数最多的那个数,不必计算就可求出。
3、个数不同
在一组数据中,平均数和中位数都具有惟一性,但众数有时不具有惟一性。在一组数据中,可能不止一个众数,也可能没有众数。
4、呈现不同
平均数:是一个“虚拟”的数,是通过计算得到的,它不是数据中的原始数据。
中位数:是一个不完全“虚拟”的数。当一组数据有奇数个时,它就是该组数据排序后最中间的那个数据,是这组数据中真实存在的一个数据;但在数据个数为偶数的情况下,中位数是最中间两个数据的平均数,它不一定与这组数据中的某个数据相等,此时的中位数就是一个虚拟的数。
众 数:是一组数据中的原数据 ,它是真实存在的。
5、代表不同
平均数:反映了一组数据的平均大小,常用来一代表数据的总体 “平均水平”。
中位数:像一条分界线,将数据分成前半部分和后半部分,因此用来代表一组数据的“中等水平”。
众数:反映了出现次数最多的数据,用来代表一组数据的“多数水平”。
这三个统计量虽反映有所不同,但都可表示数据的集中趋势,都可作为数据一般水平的代表。
6、特点不同
平均数:与每一个数据都有关,其中任何数据的变动都会相应引起平均数的变动。主要缺点是易受极端值的影响,这里的极端值是指偏大或偏小数,当出现偏大数时,平均数将会被抬高,当出现偏小数时,平均数会降低。
中位数:与数据的排列位置有关,某些数据的变动对它没有影响;它是一组数据中间位置上的代表值,不受数据极端值的影响。
众数:与数据出现的次数有关,着眼于对各数据出现的频率的考察,其大小只与这组数据中的部分数据有关,不受极端值的影响,其缺点是具有不惟一性,一组数据中可能会有一个众数,也可能会有多个或没有 。
7、作用不同
平均数:是统计中最常用的数据代表值,比较可靠和稳定,因为它与每一个数据都有关,反映出来的信息最充分。平均数既可以描述一组数据本身的整体平均情况,也可以用来作为不同组数据比较的一个标准。因此,它在生活中应用最广泛,比如我们经常所说的平均成绩、平均身高、平均体重等。
中位数:作为一组数据的代表,可靠性比较差,因为它只利用了部分数据。但当一组数据的个别数据偏大或偏小时,用中位数来描述该组数据的集中趋势就比较合适。
众数:作为一组数据的代表,可靠性也比较差,因为它也只利用了部分数据。。在一组数据中,如果个别数据有很大的变动,且某个数据出现的次数最多,此时用该数据(即众数)表示这组数据的“集中趋势”就比较适合。
登录并加入会员可无限制查看知识点解析