功能测试】什么是大数据测试?_第2页回答

2020-12-08 07:56发布

22条回答
爱梦 -拿来吧你
1楼 · 2020-12-08 09:29.采纳回答

大数据测试三个步骤:

步骤一:数据阶段验证

大数据测试的第一步,也称作pre-hadoop阶段该过程包括如下验证:

1)来自各方面的数据资源应该被验证,来确保正确的数据被加载进系统。

2)将源数据与推送到Hadoop系统中的数据进行比较,以确保它们匹配。

3)验证正确的数据被提取并被加载到HDFS正确的位置。

该阶段可以使用工具Talend或Datameer,进行数据阶段验证。

步骤二:"MapReduce"验证

大数据测试的第二步是MapReduce的验证。在这个阶段,测试者在每个节点上进行业务逻辑验证,然后在运行多个节点后验证它们,确保如下操作的正确性:

1)Map与Reduce进程正常工作。

2)在数据上实施数据聚合或隔离规则。

3)生成键值对。

4)在执行Map和Reduce进程后验证数据。

步骤三:输出阶段验证

大数据测试的最后或第三阶段是输出验证过程。生成输出数据文件,同时把文件移到一个EDW(Enterprise Data Warehouse:企业数据仓库)中或着把文件移动到任何其他基于需求的系统中。在第三阶段的活动包括:

1)检查转换(Transformation)规则被正确应用。

2)检查数据完整性和成功的数据加载到目标系统中。

3)通过将目标数据与HDFS文件系统数据进行比较来检查没有数据损坏。


梦到内河_
2楼 · 2020-12-08 19:56


比如用户数据量大的时候系统会不会崩,能不能稳定,还有累积到很多数据的时候系统还能不能正常运行

测试大数据应用程序更多的是验证其数据处理,而不是测试软件产品的个别功能。当涉及到大数据测试时,性能和功能测试是关键。在大数据测试中,QA工程师使用集群和其他组件来验证对TB级数据的成功处理。因为处理非常快,所以它需要高水平的测试技能。

大数据应用程序的测试更多的是去验证其数据处理而不是验证其单一的功能特色。当然在大数据测试时,功能测试和性能测试是同样很关键的。对于大数据测试工程师而言,如何高效正确的验证经过大数据工具/框架成功处理过的至少百万兆字节的数据将会是一个巨大的挑战。因为大数据高效的处理测试速度,它要求测软件工程师具备高水平的测试技术才能应对大数据测试。


小杨小杨
4楼 · 2020-12-11 18:08

大数据测试主要是:1、实时大数据量。2、极限状态下的测试。3、前面两种的结合。测试系统已经累积较大数据量时,一些实时产生较大数据量的模块能否稳定地工作。




爱搞事的IT小男孩
5楼 · 2020-12-13 14:46

大数据是用于大量结构化或非结构化数据的术语,这些数据有可能提供一些信息。谈论大数据时,具体的数据量无从告之,但通常都是拍字节(Petabytes)和艾字节(Exabytes)数量级的。如此大量的数据很难集成。大数据,活泼的快速移动数据,有助于更好地了解客户和产品,从而带动业务增长。尽管有许多技术可用,技术人员仍然很难找出从哪里开始。


大数据测试

测试大数据应用程序更多的是验证其数据处理,而不是测试软件产品的个别功能。当涉及到大数据测试时,性能和功能测试是关键。在大数据测试中,QA工程师使用集群和其他组件来验证对TB级数据的成功处理。因为处理非常快,所以它需要高水平的测试技能。

大数据应用程序的测试更多的是去验证其数据处理而不是验证其单一的功能特色。当然在大数据测试时,功能测试和性能测试是同样很关键的。对于大数据测试工程师而言,如何高效正确的验证经过大数据工具/框架成功处理过的至少百万兆字节的数据将会是一个巨大的挑战。因为大数据高效的处理测试速度,它要求测软件工程师具备高水平的测试技术才能应对大数据测试。

大数据处理的三个特性:1)大批量 2)实时性 3)可交互。另外,数据质量也同样是大数据测试的一个重要维度。

因此在进行应用程序测试之前,必须确保数据质量,并且考虑把数据质量作为数据库测试的一部分。涉及数据的各种特性的检验,例如一致性、准确性、重复性、连贯性、有效性及完整性等等。


我的网名不再改
7楼 · 2020-12-20 15:49

一、大数据测试基本概念
1、、什么是大数据?
大数据是一个大的数据集合,通过传统的计算技术无法进行处理。这些数据集的测试需要使用各种工具、技术和框架进行处理。大数据涉及数据创建、存储、检索、分析,而且它在数量、多样性、速度方法都很出色。

2、什么是BI?
BI(Business Intelligence)即商务智能,它是一套完整的解决方案,用来将企业中现有的数据(原始数据或商业数据或业务数据等)进行有效的整合,快速准确地提供报表并提出决策依据,帮助企业做出明智的业务经营决策。
原始数据记录了企业日常事务,例如与客户交互的信息、财务信息,员工相关记录等等。
这些数据可以用于汇报、分析、挖掘、数据质量、交互、预测分析等等

3、什么是数据仓库?
数据仓库是为查询和分析而不是事务处理而设计的数据库。
数据仓库是通过整合不同的异构数据源而构建起来的。
数据仓库的存在使得企业或组织能够将整合、分析数据工作与事务处理工作分离。
数据能够被转换、整合为更高质量的信息来满足企业级用户不同层次的需求。

4、什么是ETL?
ETL是Extract-Transform-Load的缩写(提取-转换-载入),是一个完整的从源系统提取数据,进行转换处理,载入至数据仓库的过程。

二、大数据测试类型
测试大数据应用程序更多的是验证其数据处理,而不是测试软件产品的个别功能。当涉及到大数据测试时,性能和功能测试是关键。

在大数据测试中,QA工程师使用集群和其他组件来验证对TB级数据的成功处理。因为处理非常快,所以它需要高水平的测试技能。处理可以是三种类型:批量、实时、交互
在这里插入图片描述
与此同时,数据质量也是大数据测试的一个重要因素。在测试应用程序之前,有必要检查数据的质量,并将其视为数据库测试的一部分。它涉及检查各种字段,如一致性,准确性,重复性,有效性,数据完整性等。


猜不到结尾
8楼 · 2020-12-22 09:36

测试大数据应用程序更多的是验证其数据处理,而不是测试软件产品的个别功能。当涉及到大数据测试时,性能和功能测试是关键。在大数据测试中,QA工程师使用集群和其他组件来验证对TB级数据的成功处理。因为处理非常快,所以它需要高水平的测试技能。

大数据应用程序的测试更多的是去验证其数据处理而不是验证其单一的功能特色。当然在大数据测试时,功能测试和性能测试是同样很关键的。对于大数据测试工程师而言,如何高效正确的验证经过大数据工具/框架成功处理过的至少百万兆字节的数据将会是一个巨大的挑战。因为大数据高效的处理测试速度,它要求测软件工程师具备高水平的测试技术才能应对大数据测试。


浅浅77
9楼 · 2020-12-30 15:10

大数据应用测试:

基本上,大数据应用中的数据验证,包括根据业务需求验证数据。认为数据仓库应用和大数据应用的测试是一样的想法,是完全错误的。下面,让我们了解测试大数据应用的方法。

1、大数据应用中的数据。

数据仓库和大数据应用之间的数据量,数据种类,数据速度和数据价值都不同。在数据仓库应用中,数据可以是千兆字节量,而在大数据应用的情况下,数据可以扩展到peg字节。

数据仓库应用中的数据种类只是“结构化数据”。数据仓库应用仅可以存储和处理结构化数据。在大数据应用中,数据类型的存储和处理没有约束。数据仓库应用通过批处理来处理数据,而在大数据应用中,数据也可以通过流处理。

在数据仓库应用中,测试人员只需要处理结构化数据,而在大数据应用的情况下,测试人员可能需要挖掘非结构化的半结构化数据。从测试的角度来看,测试人员需要在大数据应用中进行数据模式转换。测试人员需要与业务和开发团队合作,了解如何从给定的数据源动态导出结构。在数据仓库应用中的测试方法是“抽样”穷举验证方法。而在大数据应用的情况下,这一理论不起作用。在这样大量的数据中,最好的测试方法是通过研究、开发。这是测试人员非常具有创新性和挑战性的任务。

2、大数据应用的基础设施。

数据仓库应用存储基于关系数据库管理系统,而大数据应用存储基于文件系统。大数据应用能够将数据存储在多个集群中。这些应用程序使用对数据存储没有任何限制的Apache Hadoop。hadoop分布式文件系统是一个共享存储系统,可以通过MapReduce技术进行分析。

使用Hadoop系统,客户能够存储大量数据,并使用大数据集上的查询处理这些数据,并在短时间响应结果。对可以检索的数据量没有约束。对于测试员,这意味着需要测试的需求数量会增加。因此,需要加强测试过程,以避免应用中的灾难。在这些应用中,可以在hadoop测试环境本身进行测试。所以测试人员需要学习如何使用hadoop系统,因为它与普通文件系统不同。

3、使用验证工具测试应用

对于大数据应用,没有特定地工具。hadoop系统具有MapReduce技术等工具。编程软件,如HIVE QL和PIGlatin建立在MapReduce上。如果了解SQL知识,更容易学习HIVE Q / HIVE QL,用于访问简单的数据结构,但它不能处理复杂的嵌套数据结构。它没有所有的构造来访问Hadoop系统的数据进行验证。PIGlatin是另一种不需要复杂编码的工具。这两个都在开发中,因此编写MapReduce程序来执行测试是无法实现的。对于测试人员来说,这是一个很大的挑战,因为需要基于脚本技术进行工作,或者他们需要从供应商或内部团队中寻找自动化工具,以便为Hadoop架构提供了一个更容易测试数据验证的接口。

大数据应用程序的测试策略和测试步骤?

在大数据应用中,更多的测试是验证数据,而不是测试单一地软件产品。在大数据应用中,测试人员使用聚类方法和其他组件验证大量数据的数据处理。测试大数据需要测试人员非常熟练,因为数据的处理速度非常快。主要是测试团队要对大数据应用进行功能和性能测试。可以实时或交互地处理数据,也可以进行批处理。在测试应用程序之前检查数据的质量也很重要。检查数据质量通常被认为是数据库测试的一部分。它涉及检查数据的一致性,有效性,准确性等。

1、数据验证:这是测试大数据应用的第一步,也称为hadoopop测试。这是一个数据验证步骤。此步骤涉及检查来自诸如媒体博客,数据库等不同来源的正确数据是否被拉入系统。该数据被推入hadoop系统,现在检查源数据,以便它们在hadoop系统中匹配。此外,如果正确的数据被提取并推入正确的hadoop位置,那么它将被验证。我们可以使用Talend等工具进行数据验证。

2、业务逻辑验证:在此测试人员验证每个节点上的业务逻辑,然后对多个节点进行验证。它是“地图缩小”的验证。在该步骤中,检查地图缩小过程的正确性,数据在地图缩小过程之后被验证,检查数据的聚合和分离。

3、输出验证:这是大数据处理的最后阶段。生成的输出数据文件已准备好移动到数据仓库或任何其他系统。在此步骤中,我们检查数据完整性和数据是否成功加载到目标系统中,通过将目标数据与HDFS文件系统进行比较来检查是否有数据损坏。

大数据应用程序的性能测试步骤?

1、准备了一大批数据,进行测试。

2、确定各自的工作负载。

3、创建脚本。

4、执行测试并观察结果。如果结果不满足,则重新配置并重新执行测试。

5、大数据应用中的性能测试有各种参数,如数据存储在不同节点,并发,缓存,超时,消息速率,消息大小,地图缩小性

相关问题推荐

  • 回答 6

    、 黑盒测试:是一种常用的软件测试方法,它将被测软件看作一个打不开的黑盒,主要根据功能需求设计测试用例,进行测试。几种常用的黑盒测试方法和黑盒测试工具有,等价类划分法、边界值分析法、因果图法、决策表法。在实际运用中要选择合适的方法。二、 因果...

  • 回答 4

    果图法是一种适合于描述对于多种输入条件组合的测试方法,根据输入条件的组合、约束关系和输出条件的因果关系,分析输入条件的各种组合情况,从而设计测试用例的方法,它适合于检查程序输入条件涉及的各种组合情况。因果图法一般和判定表结合使用,通过映射同...

  • 回答 5

    判定表(Decision Table)是分析和表达多逻辑条件下执行不同操作的情况下的工具.在程序设计发展的初期,判定表就已被当作编写程序的辅助工具了.由于它可以把复杂的逻辑关系和多种条件组合的情况表达得既具体又明确....

  • 回答 5

    判定表通常有以下四个部分组成:1)条件桩(Condition Stub):列出了问题的所有条件。通常认为列出的条件的次序无关紧要。2)动作桩(Action Stub):列出了问题规定可能采取的操作。这些操作的排列顺序没有约束。3)条件项(Condition Entry):列出针对它左列...

  • 回答 3

    长期的测试工作经验告诉我们,大量的错误是发生在输入或输出范围的边界上,而不是发生在输入输出范围的内部。因此针对各种边界情况设计测试用例,可以查出更多的错误。使用边界值分析方法设计测试用例,首先应确定边界情况。通常输入和输出等价类的边界,就是...

  • 回答 2

    1) 边界值分析不是从某等价类中随便挑一个作为代表,而是使这个等价类的每个边界都要作为测试条件。2) 边界值分析不仅考虑输入条件,还要考虑输出空间产生的测试情况。

  • 回答 4

    边界值分析方法是对等价类划分方法的补充. 长期的测试工作经验告诉我们,大量的错误是发生在输入或输出范围的边界上,而不是发生在输入输出范围的内部.因此针对各种边界情况设计测试用例,可以查出更多的错误.使用边界值分析方法设计测试用例...

  • 回答 7
    已采纳

    在编程中,布尔量指一个真或假状态。通常它们分别用0,1或1,-1来表示,这和编程语言有关。具体来说当布尔量为真的时候表示一个表达式或判断成立,否则这个式子或判断不成立。你把它理解为成立或不成立就行了。...

  • 回答 1

    1)输入条件规定取值范围,则卡定义一个有效等价类和两个无效等价类。例如学生成绩范围是0~100,则一个有效类:0

  • 回答 6

    1,先确定等价类别2,找出有效等价类和无效等价类3,边界值找好,尽可能多的找的会有重复的数据4,有效等价类尽可能条件符合的归一起不要重复5,无效等价类单独写开6,写好测试用例7,执行测试用例...

  • 回答 4

    应用场景:只要有数据输入的地方就可以采用等价类划分法。按照需求,把无穷多的数据进行分类,从中挑选出代表性数据进行测试。具体操作:(1)明确测试对象(测试什么)(2)划分等价类(按照需求分有效、无效)(3)细化等价类(有效、无效进行细化)(4)建...

  • 回答 10

       采用黑盒技术设计测试用例的方法有:等价类划分、边界值分析、错误推测、因果图和综合策略。

  • 回答 7

    Priority()和Severity(严重程度)是的两个重要属性。很多新人经常混淆这两个概念。通常,人员在提交Bug时,只定义Bug的Severity, 即该Bug的严重程度,而将Priority交给Project Leader 或Team Leader来定义,由他们来决定该Bug被修复的优先等级。某种意义上来说...

  • 回答 5

    1致命:致命是指系统主要功能丧失,用户数据受到破坏,造成系统崩溃、悬挂、死机或者危及人身安全等的问题。例如程序所引起的死机,非法退出、死循环、数据库发生死锁、数据流环节上严重的数值计算错误、产品设计存在严重的安全问题、漏洞被利用后可能导致系统...

  • 回答 3
    已采纳

    1、New:(新的)当某个bug被发现的时候(第一次),测试人员需要与项目负责人沟通以确认发现的的确是一个bug,如果被确认是一个bug,就将其记录下来,并将bug的状态设为New。2、Assigned(已指派的)当一个bug被指认为New之后,将其将给开发人员,开发人员将...

  • 回答 2

    软件缺陷是计算机软件或程序中存在的某种破坏正常运行能力的问题、错误,或者隐藏的功能缺陷。缺陷的存在会导致软件产品在某种程度上不能满足用户的需要。IEEE729-1983对缺陷有一个标准的定义:从产品内部看,缺陷是软件产品开发或维护过程中存在的错误、毛病等...

没有解决我的问题,去提问