📜  人口和样本统计

📅  最后修改于: 2022-05-13 01:58:08.962000             🧑  作者: Mango

人口和样本统计

人口:

对象或测量值的完整集合称为总体,否则我们想要了解的组中的所有内容都称为总体。否则在统计中,总体是在统计研究中从中提取数据的整个项目集。它可以是一组个人或一组项目。

人口是您要得出结论的整个群体。

总体通常用N表示

  1. 居住在拉贾斯坦邦的公民人数代表该州的人口
  2. 所有拥有国际棋联等级的棋手代表了世界国际象棋联谊会的人口
  3. 整个宇宙的行星数量代表了整个宇宙的行星数量
  4. 糖果和巧克力的种类是在印度制造的。

总体平均值通常用希腊字母 μ 表示

                                                                   μ (人口平均数)=N i=1 (xi) / N(总人口数)

例如:假设我公司有 5 名员工,所以 5 人是一个完整的集合,因此它将代表我公司的人口

如果我想找到我公司的平均年龄,那么我只需将他们的年龄相加,然后除以 N,即人口数量

年龄 = {23,45,12,34,22}

μ = ∑ 5 i=1 (xi)/5

= (23 + 45 + 12 + 34 + 22) / 5

结果说我公司的平均年龄是27.2岁

所以这就是我们所说的人口平均数。这里的人口要少得多,所以计算人口均值是一项容易的任务,但如果我们要计算印第安人的平均身高,那几乎是不可能完成的任务,因为每一秒都有一个人在出生,而一个人在死。因此,即使不是不可能,这也是一项艰巨的任务。

由于在这种情况下和许多其他情况下,由于时间限制、地理可及性的限制和研究人员资源的限制,不可能观察到整个统计人口,研究人员将改为观察同一人口的样本以尝试学习关于整个人口的一些事情。这给我们带来了什么是样本?

样本:

样本代表了我们将用来表示数据的人群兴趣组。样本是我们代表整个数据的总体的无偏子集。样本是实际参与调查或研究的一组元素。

样本是可管理大小的表示。收集样本并从样本中计算统计数据,以便可以从样本中进行干扰或推断。从样本中收集信息的过程称为抽样。

样本用n表示

  1. 拉贾斯坦邦总人口中的 500 人将被视为样本
  2. 将所有棋手总数中的143名棋手作为样本

样本均值用 x 表示 –

x (样本均值) =n i=1 (xi)/n (总样本)

例如:

  1. geeksforgeeks 的用户总数是人口,网站的所有学生帐户都是一个样本。
  2. 总体中所有 FIDE 评级的棋手和评级超过 1700 的棋手都是样本。
  • 如何从人群中收集数据?

当研究人员或业务分析师需要大量可用且易于访问的每个人的信息时,就会从人群中收集数据。当研究人员的问题需要或您可以访问人口中每个成员的数据时,将使用人口。通常,当数据集非常小时使用总体

示例:在有 599成员学生的大学中,如果我们要删除每个人口的平均 BMI。

  • 如何从样本中收集数据

当总体规模很大或分散或无法收集单个实例的数据时,使用样本。

示例:假设印度的人口为 1000 万,最近在印度进行了两党“A 党”和“B 党”之间的选举,现在研究人员想要找出哪个党获胜,所以在这里我们将创建一组少数人人们可以说来自不同地区和年龄组的 10,000 人,这样样本就不会有偏差。然后问他们投票给谁,我们可以得到出口民意调查。 This is the thing which most of our media do during the elections, and show stats such as there 55% chances of party A winning the elections.