Big Data】怎么理解机器学习中的聚类和分类算法

2020-05-18 09:00发布

1条回答
wjmmjr
2楼 · 2020-05-19 10:49

分类:是已知类别时,对数据进行按标签进行划分到不同类别中,属于有监督的学习。

聚类:是在没有标签的情况下,将相似的数据划分到一个类中,属于无监督的学习。

相关问题推荐

  • 回答 2

    在互联网逐渐步入大数据时代后,不可避免的为企业及消费者行为带来一系列改变与重塑。其中最大的变化莫过于,消费者的一切行为在企业面前似乎都将是可视化的。随着大数据技术的深入研究与应用,企业的专注点日益聚焦于怎样利用大数据来为精准营销服务,进而深...

  • 回答 1

    这跟年限关系并不代表,主要看技术能力,工作10年技术不行,薪资一样相对较低,毕业一年技术很牛,工资也没有上限,技术可以的话,一线城市薪资能达到5位数

  • 回答 1

    在线上的hadoop集群运维过程中,hadoop 的balance工具通常用于平衡hadoop集群中各datanode中的文件块分布,以避免出现部分datanode磁盘占用率高的问题(这问题也很有可能导致该节点CPU使用率较其他服务器高)。可能的原因:突然磁盘使用率变高而文件块数并没...

  • 回答 1

    其实属于一个领域,先用大数据技术将数据进行采集、存储、计算,然后根据结果利用机器学习搞一些模型、算法进行预测,人工智能建立在这之上

  • 回答 1

      PageRank,即网页排名,又称网页级别、Google左側排名或佩奇排名。        是Google创始人拉里·佩奇和谢尔盖·布林于1997年构建早期的搜索系统原型时提出的链接分析算法,自从Google在商业上获得空前的成功后,该算法也成为其他搜索引擎和学术界十...

  • 回答 1

    是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合

  • 回答 3
    已采纳

    监督学习(supervised learning)从给定的训练数据集中学习出一个函数(模型参数),当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求包括输入输出,也可以说是特征和目标。训练集中的目标是由人标注的。监督学习就是最常见的分类(注意和...

  • 回答 1

    使用已经建立好的数学模型,进行数据的挖掘机器学习是利用已知的算法来进行模型的训练

  • 回答 1

    很成熟的一个推荐算法使用在推荐些用户喜欢的产品,视屏等方便

  • 回答 2

    机器学习——实现人工智能的一种方式深度学习——一种实现机器学习的技术

  • 回答 3

    机器学习中的神经网络分支包括深度学习。深度学习相对于普通的神经网络的优势在于,可以自动提取特征。将人从以前的手动提取特征的繁琐中解放出来,只需要会一套流程,就可以达到很好的效果。...

  • 回答 3

    机器学习可能会广泛应用到日常生活,但是普及开来学习还有一定的时间,课程难度会有一方面,学习成本也比较大,所以短时间内很普及可能性还是不太大的。

  • 回答 1

    其实这个是两个词的组合,可以拆分为TF和IDF。TF(Term Frequency,缩写为TF)也就是词频啦,即一个词在文中出现的次数,统计出来就是词频TF,显而易见,一个词在文章中出现很多次,那么这个词肯定有着很大的作用,但是我们自己实践的话,肯定会看到你统计出...

没有解决我的问题,去提问