コードの重複の中で特に影響の大きいもの。 共通化するべき部分が共通化されていない場合などに発生する。
コードの重複の大きさ。 重複が十分大きいかの判定で使用。
コードの重複間の距離。 重複が1つの塊かの判定で使用。
重複の塊の大きさ。 コードの塊が十分大きいかの判定で使用。
メトリクスの取り出しの前処理。 ASTを元にSuffix Treeを構築する手法を使用。
ポーランド記法のイメージ。 各ノードに子ノード数を紐づけるのがポイント。
接尾辞(文字列の最後NNN文字)を木構造にしたもの。 文字数NNNとして時間計算量O(N)O(N)O(N)で構築可能。 例)banana
Suffix Treeの深さ優先探索で検出可能。 時間計算量O(N)O(N)O(N)。
子ノードの数を元にノード列を切っていく。