统计学(复习)

admin•2025-03-22 20:02:23•建站资讯•阅读60

统计学(复习)

2024年4月18日发(作者：)

第1章统计和统计数据

1统计学的定义：是收集、处理、分析、解释数据并从数据中得出结论的科学

描述统计与推断统计的含义、内容、目的.

描述统计: 是研究数据收集，处理和描述的统计学方法。其内容包括如何取得研究所需要的数据，如何用图

表形式对数据进行处理和展示，如何通过对数据的综合,概括与分析，得出所关心的数据特征。

推断统计：是研究如何利用样本数据来推断总体特征的统计学方法，内容包括两大类：

参数估计: 是利用样本信息推断所关心的总体特征.

假设体验：是利用样本信息判断对总体的某个假设是否成立.

2、变量与数据:不同数据类型的含义，会判断已有数据的类型.

变量：它们的特点是从一次观察到下一次观察会出现不同结果。

Ex：企业销售额，上涨股票的家数, 生活费支出,投掷一枚骰子观察其出现的点数

数据：把观察到的结果记录下来。

总体:包含所研究的全部个体（数据)的集合

样本: 从总体中抽取的一部分元素的集合

样本量: 构成样本的元素的数目

定量变量或数值变量：定量变量的观察结果称为定量数据或数值型数据。可以用阿拉伯数据来记录其观察结

果 .如“企业销售额"、“上涨股票的家数”、“生活费支出”、“投掷一枚骰子出现的点数”

定性变量：分类变量和顺序变量统称为定性变量

分类变量:表现为不同的类别.如“性别”、“企业所属的行业”、“学生所在的学院” 等.

分类变量的观察结果就是分类数据

顺序变量或有序分类变量: 具有一定顺序的类别变量。如考试成绩按等级，一个人对事物的态

度。顺序变量的观察结果就是顺序数据或有序分类数据

离散型变量：只能取有限个值得随机变量

连续型变量：可以取一个或多个区间中任何值得随机变量

3、获得数据的概率抽样方法有哪些？

根据一个已知的概率来抽取样本单位，也称随机抽样

-简单随机抽样:从总体

个单位(元素)中随机地抽取

个单位作为样本,使得总体中每一个元素都有相同的

机会(概率）被抽中。抽取元素的具体方法有重复抽样是抽取一个个体记录下数据后，再把这个个体放回到

原来的总体中参加下一次抽选。不重复抽样抽中的个体不再放回，再从所剩下的个体中抽取第二个元素，直

到抽取n 个个为止。

- 分层抽样或分类抽样:它是在抽样之前先将总体的元素划分为若干层（类)，然后从各个层中抽取一定数量的

元素组成一个样本。

-系统抽样或等距抽样：它是想将总体个元素按某个顺序排列，并按某种规则确定一个随机起点，然后，每隔

一定的间隔抽取一个元素，直至抽取n 个元素组成一个样本。

-整群抽样：是先将总体划分成若干群，然后以群作为抽样单元从中抽取部分群组成一个样本，再对抽中的每

个群中包含的所有元素进行观察.

第二章. 用图表展示数据

频数: 落在各类别中的数据个数

比例: 某一类别数据个数占全部数据个数的比值

百分比:将对比的基数作为100而计算的比值

比率：不同类别数值个数的比值

频数分布表: 频数分布表中落在某一特定类别数据.频数分布包含了很多有用的信息，通过它可以观察不同类

型数据的分布状况。

什么是条形图: 是用宽度相同的条形来表示数据多少的图形用于观察不同类别数据的多少或分布状况。

帕累托图: 是按各类别数据出现的频数多少排序后绘制的条形图

饼图: 是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分道

德数据占全部数据的比例，对于研究结构性问题十分有用。

环形图: 只能显示一个样本各部分所占的比例

数据分组：是根据统计研究的需要,将原始数据按照某种标准化分成不同的组别。

1。下限（lower limit) ：一个组的最小值

2。上限(upper limit） :一个组的最大值

3。组距(class width）：上限与下限之差

4。组中值（class midpoint）：下限与上限之间的中点值

发布者：admin，转转请注明出处：http://www.yc00.com/news/1713402292a2241988.html

数据变量样本抽取观察

admin

网站建设
下载HuggingFace模型和数据集（免翻墙）
首推 huggingface 镜像站： https:hf-mirror 。首推工具：官方的 huggingface-cli 命令行工具这个知乎博主总结的很全面如何快速下载hugging
admin
1月前
50
网站建设
salesforce 遍历所有用户，提取每个用户可以访问的 Opportunity 数据，并将数据发送给用户
要遍历所有用户，提取每个用户可以访问的机会（Opportunity）数据，并将数据发送给用户，可以按照以下步骤实现&#xf
admin
27天前
20
网站建设
解决sparkstreaming读取kafka中的json数据，消费后保存到MySQL中，报_corrupt_record和name错误的！！
所用软件版本： spark2.3.0 IDEA2019.1 kafka_2.11-01.0.2.2 spark-streaming-kafka-0-10_2.11-2.3.0 先贴出代码： package com.bd.spar
admin
27天前
30
网站建设
X-AnyLabeling自动标注数据集并训练自己的YOLO11目标检测模型
X-AnyLabeling Datasets & YOLO11 Object Detection 前言1. 介绍2. 系统环境3. 安装 X-AnyLabeling 标注工具3.1 从源码安装3.2 从GUI运行 4. 制作YOLO
admin
27天前
10
网站建设
U盘中毒后文件乱码？数之寻软件助你高效恢复数据
一、U盘中毒与文件乱码的困扰在数字化时代，U盘作为便携式存储设备，广泛应用于数据传输与备份中。然而，U盘在方便我们生活与工作的同时，也面临着诸多安全
admin
27天前
40
网站建设
u盘删除的文件怎么找回？3个策略，恢复数据乐开颜
U盘常常是打工人必备工具，方便我们携带、传输、备份和存储各种重要的数据。但失误经常发生，导致其中的数据“一贫如洗”。u盘删除的文件怎么找回呢？有什么简单快速的方法帮助恢复&a
admin
27天前
20
网站建设
U盘容量变0字节：故障解析与数据拯救指南
一、U盘容量变0字节的现象描述 U盘作为我们日常存储和传输数据的重要工具，其稳定性和可靠性至关重要。然而，有时我们会突然发现U盘的容量突然变为0字节，这意味着原本存储在U盘
admin
27天前
20
网站建设
u盘显示需要格式化才能用预警下的数据拯救恢复指南
U盘困境：需要格式化的紧急应对在数字信息爆炸的时代，U盘作为便携的数据存储介质，承载着我们工作、学习乃至生活中的大量重要资料。然而，当U盘突然弹出“
admin
27天前
40
网站建设
1800亿参数，支持中文，3.5万亿训练数据！开源类ChatGPT模型
这个必须推荐一下：1800亿参数，支持中文，3.5万亿训练数据！开源类ChatGPT模型阿联酋阿布扎比技术创新研究所（Tech
admin
26天前
30
网站建设
相机格式化怎么恢复数据？记住这个实用办法！
相机里的照片不小心被格式化了，还能恢复照片吗？别担心，恢复照片还是有可能的。本篇文章会告诉你，如果相机被格式化了，怎么找回那些珍贵
admin
26天前
10
网站建设
数据销毁，确保硬盘数据无法恢复
数字化时代，数据的价值不言而喻，保护数据安全不仅仅是防止数据丢失，我们还要知道如何防止数据泄露。比如，当我们不再需要某些数据时，要
admin
26天前
00
网站建设
java opendht_GitHub - DHT-openyouseed-spider-saver-public: DHT磁力爬虫入库程序，将爬取到的数据保存至Mongo、ES或者Mysql...
Youseed磁力爬虫入库程序此程序使用Java编写，负责将rabbitMQ消息队列中的数据保存至数据库或者搜索引擎。注意：此程序是上图右侧方框“保存磁力数据”的部分。此程序仅用作技术学习和
admin
26天前
20
网站建设
巨量千川M-API开端：账户下的短视频计划数据获取（一）
啦啦啦，巨量千川的M-API的实践在上一份使用教程之后正式开始记录设计思路及具体步骤啦！详细的其实还是要看一下巨量引擎工作台中的开发文档API接口 - 商业开放平台，本文所讲
admin
26天前
50
网站建设
SAP-PM设备模块-PM主数据之设备BOM
1、简介： 根据设备维修所需要的备品备件以及低值易耗来建立该设备的设备BOM，帮助并指导维修，可以方便我们在维修时快速选择配件同时也能规范和指导我们设备维修所需要的材料。
admin
25天前
20
网站建设
SAP-PM设备模块-PM主数据之功能位置
1、简介： 功能位置是设备安装的位置，一般来说会有一个或多个设备安装在功能位置上（如设备工位就是一个功能位置，电机和泵作为设备安装在功能位置上&
admin
25天前
60
网站建设
大数据技术15：大数据常见术语汇总
前言：大数据的出现带来了许多新的术语，但这些术语往往比较难以理解。因此，通过本文整理了大数据开发工程师经常会接触到的名词和概念，了解这些专有名词对于数据
admin
20天前
20
网站建设
c语言超大数计算,c语言中怎么办一个特别大的数据的运算
我的计算器只能计算乘法加法太简单了自己，拿我的程序自己去改可以计算最大100位乘100位的数字修改程序第2行的abc的数组大小可以把计算数据大小改成无限大所有的注释掉的输出都是在写程序的时候自
admin
16天前
20
网站建设
spark大数据入门（一）如何在windows下部署spark开发环境
spark机器学习： spark现如今在大数据领域有着很重的地位，lz最喜欢的是基于spark之上的机器学习，也就是MlIB，这是基于分布式环境下的机器
admin
16天前
00
网站建设
数据分析师必看，盘点最常用的四种数据统计分析方法
在当今数据驱动的商业环境中，数据分析已成为企业获取竞争优势的关键工具。随着数据量的不断增加，企业面临着前所未有的机遇与挑战。通过有效的数据分析，企业可以优化运营效率、提高客户
admin
2天前
30
网站建设
Neshta样本分析
前段时间群里一位师傅开远程桌面暴露3389端口时被人打了，然后上传了一个勒索程序，并触发了，在该师傅一番抢救后留下了一个样本，丢到微步上看了看之前好像还
admin
2天前
20

发表回复

评论列表（0条）

暂无评论

统计学(复习)

发表回复

评论列表（0条）

联系我们

400-800-8888

统计学(复习)

相关推荐

发表回复

评论列表（0条）

联系我们

400-800-8888