梗概
- 分析两个数据项的相关性
- 比较数据项中的多个属性
通用的计算方式
- use::余弦相似度
- use::Jaccard相似系数
距离
[base::二元属性]的相似度
原文
数据对象与对象之间相似度与相异度的度量_简单匹配系数-CSDN博客
相似系数(similarity coeffcient)
通常在 0 和 1 之间取值,值为 1 表明两个对象完全相似,而值为 0 表示对象一点也不相似。
简单匹配系数(Simple Matching Coefficient,SMC)
x 和 y 是两个对象,都由 n 个二元属性组成。这样的两个对象(即两个二元向量)的比较可以生成如下四个量(频率):

简单匹配系数定义:

SMC 可以在一个仅包含是非题的测验中用来发现回答问题相似的学生