梗概

  • 分析两个数据项的相关性
    • 比较数据项中的多个属性

通用的计算方式

距离

[base::二元属性]的相似度

原文

数据对象与对象之间相似度与相异度的度量_简单匹配系数-CSDN博客

相似系数(similarity coeffcient)

通常在 0 和 1 之间取值,值为 1 表明两个对象完全相似,而值为 0 表示对象一点也不相似。

简单匹配系数(Simple Matching Coefficient,SMC)

x 和 y 是两个对象,都由 n 个二元属性组成。这样的两个对象(即两个二元向量)的比较可以生成如下四个量(频率):

简单匹配系数定义:

SMC 可以在一个仅包含是非题的测验中用来发现回答问题相似的学生