怎么用Minitab检验数据好坏

2020-10-22 10:32发布

4条回答
小猪仔
2楼 · 2020-10-22 14:29

1.设计类型是完全随机设计两组数据比较,不知道数据是否是连续性变量。

2.比较方法:如果数据是连续性数据,且两组数据分别服从正态分布&方差齐(方差齐性检验),则可以采用t检验,如果不服从以上条件可以采用秩和检验。

3.想知道两组数据是否有明显差异?不知道这个明显差异是什么意思?是问差别有无统计学意义(即差别的概率有多大)还是两总体均数差值在哪个范围波动?如果是前者则可以用第2步可以得到P值,如果是后者,则是用均数差值的置信区间来完成的。当然两者的结果在SPSS中均可以得到。

4.对以上结果SPSS的实现是:

(1)t检验,analyse→compare means→independent-samples T Test

(2)秩和检验,analyse→noparametric Test→2 independent samples


aijingda
3楼 · 2020-10-23 16:57

用Minitab作数据的正态性检验的方法有如下两种:
<1>. 统计>基本统计量>正态性检验 (stat>Basic Statistic>Normality test)
<2>. 统计>基本统计量>图形化汇总
最后都是看P值,P>0.05就基本可以认为数据正态(什么情况下P>0.05也不能判为正态分布?请跟帖者回答)。
一定要以最后的P-value作标准,而不能凭感觉。
第一种方法(stat>Basic Statistic>Normality test)下有如下三种检验方法:
(1). Anderson-Daling,缺省状态即为此检验法,AD法最灵敏。AD检验是很准确的判断方法,表面上在直线附近, 但很可能被拒绝。
(2). Ryan-Joiner (它实际上与W检验很相似,ISO将它定为标准检验方法,中国国标也采用此法)。
(3). Kolmogorov-Smirnov方法。

Anderson-Darling和Kolmogorov- Smirnov检定方法是基于经验分布函数,Ryan-Joiner (类似Shapiro-Wilk)是基于相关与回归的,一般而言都选Anderson-Darling。
正态性检验的方法很多,但具体原理是不相同的。有些是拟合优度检验,有些是偏峰度检验,Minitab常用Anderson-Darling检验。
三种检验方法的详细解释如下:
Anderson-Darling检验(A-D检验),是一种基于经验累积分布函数(ECDF)的算法,特别适用于小样本(当然也适用于大样本),AD值越小,表明分布对数据拟合度越好,A-D检验只适合特定的连续分布如:normal、lognormal、exponential、Weibull、logistic、extreme-value type 1。
A-D检验是对K-S检验的一种修正,相比K-S检验它加重了对尾部数据的考量,K-S检验具有分布无关性,它的临界值并不依赖被测的特定分布,而A-D检验使用特定分布去计算临界值,这使得A-D检验具有更灵敏的优势。
Anderson-Darling 检验
选择此项将执行正态性的 Anderson-Darling 检验,此检验是将样本数据的经验累积分布函数与假设数据呈正态分布时期望的分布进行比较。如果实测差异足够大,该检验将否定总体呈正态分布的原假设。
Ryan-Joiner检验(R-J检验,类似于Shapiro-Wilk检验),是一种基于相关性的算法。R-J检验可得到一个相关系数,它越接近1就越表明数据和正态分布拟合得越好。
A-D检验和R-J检验在正态性检验中具有相似的功效,而K-S检验的功效较弱。
对于大样本的拟合度测试,通常使用卡方检验(卡方检验是一种基于概率密度函数的算法,不适合于小样本)会更好,因为卡方检测不需要分布参数的知识,并且卡方检验适用于连续和离散分布。
Ryan-Joiner 正态性检验
选择此项将执行 Ryan-Joiner 检验,此检验通过计算数据与数据的正态分值之间的相关性来评估正态性。如果相关系数接近 1,则总体就很有可能呈正态分布。Ryan-Joiner 统计量可以评估这种相关性的强度;如果它未达到适当的临界值,您将否定总体呈正态分布的原假设。此检验类似于 Shapiro-Wilk 正态性检验。
Kolmogorov-Smirnov检验(K-S检验),也是一种基于经验累积分布函数(ECDF)的算法,K-S检验最吸引人的特性是具有分布无关性,所以适用于任何连续分布,很适合小样本(当然也适合大样本)。
但是由于K-S检验相对尾部而言,往往对分布中心更敏感,并且它的临界值并不依赖被测的特定分布,相对A-D检验而言它的灵敏度较低,所以很多的分析更愿意使用A-D 拟合度检验。
Kolmogorov-Smirnov 正态性检验
选择此项将执行正态性的 Kolmogorov-Smirnov 检验,此检验是将样本数据的经验累积分布函数与假设数据呈正态分布时期望的分布进行比较。如果实测差异足够大,该检验将否定总体呈正态分布的原假设。
如果这些检验的 p 值低于你选择的 a 水平,你可以否定原假设,并断定总体呈非正态分布。
有资料上说Anderson-darling、Ryan-Joiner、Kolmogorov-Smirnov三种检验中只要有一种给出否定的结论,就应该判定该分布非正态。
实际上AD检验即使通不过,但是另外两种能通过的话,也可以当成正态分布的,因为可以把它看成近似正态分布,这个与样本的多少有关。AD检验更适合小样本数量的检验。因此,有的时候AD通不过正态,其它两种能通过,也能把数据看作近似正态分布的。
样本容量(样本中个体的数目)仅为5~10也可以进行正态性检验。但是样本容量过少时,即使是正态,也会受到置疑。因为那要看抽样时5个样本的代表性如何。
当样本数据为非正态分布或为小样本或两样本方差不等时要用非参数检验(卡方、符号、秩和等)。
用图形化汇总来验证数据是否正态携带的信息比较多,P值、峰度、偏度都会在图形化汇总中显示出来。

image003.jpg


年年
4楼 · 2020-10-25 16:24

打开Minitab之后,点击Stat>Basic Statistics> Normality Test ,数据分析之后若 P value(P值)>0.05,说明此组数据服从正态分布,可以验证一下

哈哈哈哈哈哈嗝
5楼 · 2020-10-30 15:31

1.设计类型是完全随机设计两组数据比较,不知道数据是否是连续性变量。

2.比较方法:如果数据是连续性数据,且两组数据分别服从正态分布&方差齐(方差齐性检验),则可以采用t检验,如果不服从以上条件可以采用秩和检验。

3.想知道两组数据是否有明显差异?不知道这个明显差异是什么意思?是问差别有无统计学意义(即差别的概率有多大)还是两总体均数差值在哪个范围波动?如果是前者则可以用第2步可以得到P值,如果是后者,则是用均数差值的置信区间来完成的。当然两者的结果在SPSS中均可以得到。

4.对以上结果SPSS的实现是:

(1)t检验,analyse→compare means→independent-samples T Test

(2)秩和检验,analyse→noparametric Test→2 independent samples


相关问题推荐

  • 什么是大数据时代?2021-01-13 21:23
    回答 100

    大数据(big data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,而这个海量数据的时代则被称为大数据时代。随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。大数据(Big data)通常用来形容一个公司创造的大量非结...

  • 回答 84

    Java和大数据的关系:Java是计算机的一门编程语言;可以用来做很多工作,大数据开发属于其中一种;大数据属于互联网方向,就像现在建立在大数据基础上的AI方向一样,他两不是一个同类,但是属于包含和被包含的关系;Java可以用来做大数据工作,大数据开发或者...

  • 回答 52
    已采纳

    学完大数据可以从事很多工作,比如说:hadoop 研发工程师、大数据研发工程师、大数据分析工程师、数据库工程师、hadoop运维工程师、大数据运维工程师、java大数据工程师、spark工程师等等都是我们可以从事的工作岗位!不同的岗位,所具备的技术知识也是不一样...

  • 回答 29

    简言之,大数据是指大数据集,这些数据集经过计算分析可以用于揭示某个方面相关的模式和趋势。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。大数据的特点:数据量大、数据种类多、 要求实时性强、数据所蕴藏的...

  • 回答 14

    tail -f的时候,发现一个奇怪的现象,首先 我在一个窗口中 tail -f test.txt 然后在另一个窗口中用vim编辑这个文件,增加了几行字符,并保存,这个时候发现第一个窗口中并没有变化,没有将最新的内容显示出来。tail -F,重复上面的实验过程, 发现这次有变化了...

  • 回答 18

    您好针对您的问题,做出以下回答,希望有所帮助!1、大数据行业还是有非常大的人才需求的,对于就业也有不同的岗位可选,比如大数据工程师,大数据运维,大数据架构师,大数据分析师等等,就业难就难在能否找到适合的工作,能否与你的能力和就业预期匹配。2、...

  • 回答 17

    最小的基本单位是Byte应该没多少人不知道吧,下面先按顺序给出所有单位:Byte、KB、MB、GB、TB、PB、EB、ZB、YB、DB、NB,按照进率1024(2的十次方)计算:1Byte = 8 Bit1 KB = 1,024 Bytes 1 MB = 1,024 KB = 1,048,576 Bytes 1 GB = 1,024 MB = 1,048,576...

  • 回答 33

    大数据的定义。大数据,又称巨量资料,指的是所涉及的数据资料量规模巨大到无法通过人脑甚至主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据是对大量、动态、能持续的数据,通过运用新系统、新工具、新...

  • 回答 5

    MySQL是一种关系型数据库管理系统,关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。MySQL的版本:针对不同的用户,MySQL分为两种不同的版本:MySQL Community Server社区版本,免费,但是Mysql不提供...

  • mysql安装步骤mysql 2022-05-07 18:01
    回答 2

    mysql安装需要先使用yum安装mysql数据库的软件包 ;然后启动数据库服务并运行mysql_secure_installation去除安全隐患,最后登录数据库,便可完成安装

  • 回答 5

    1.查看所有数据库showdatabases;2.查看当前使用的数据库selectdatabase();3.查看数据库使用端口showvariableslike&#39;port&#39;;4.查看数据库编码showvariableslike‘%char%’;character_set_client 为客户端编码方式; character_set_connection 为建立连接...

  • 回答 5

    CREATE TABLE IF NOT EXISTS `runoob_tbl`(    `runoob_id` INT UNSIGNED AUTO_INCREMENT,    `runoob_title` VARCHAR(100) NOT NULL,    `runoob_author` VARCHAR(40) NOT NULL,    `submission_date` DATE,    PRI...

  • 回答 9

    学习多久,我觉得看你基础情况。1、如果原来什么语言也没有学过,也没有基础,那我觉得最基础的要先选择一种语言来学习,是VB,C..,pascal,看个人的喜好,一般情况下,选择C语言来学习。2、如果是有过语言的学习,我看应该一个星期差不多,因为语言的理念互通...

  • 回答 7

    添加语句 INSERT插入语句:INSERT INTO 表名 VALUES (‘xx’,‘xx’)不指定插入的列INSERT INTO table_name VALUES (值1, 值2,…)指定插入的列INSERT INTO table_name (列1, 列2,…) VALUES (值1, 值2,…)查询插入语句: INSERT INTO 插入表 SELECT * FROM 查...

  • 回答 5

    看你什么岗位吧。如果是后端,只会CRUD。应该是可以找到实习的,不过公司应该不会太好。如果是数据库开发岗位,那这应该是不会找到的。

  • 回答 7

    查找数据列 SELECT column1, column2, … FROM table_name; SELECT column_name(s) FROM table_name 

没有解决我的问题,去提问