找回密码
 新猫注册
查看: 596|回复: 0

[摘录][字符串处理]讨论一下相似度的问题

[复制链接]
kernel 发表于 2008-8-11 16:35:33 | 显示全部楼层 |阅读模式
  1. $str1        = "四川省成都市15街23号";
  2. $str2        = "四川成都15街yyy号";


  3. $cncharnum1        = preg_match_all("/[\xB0-\xF7][\xA1-\xFE]/", $str1,$zharr1);
  4. $ennum1                = preg_match_all("/[0-9a-zA-Z]+/", $str1,$enarr1);
  5. $newArray1        = array_merge($zharr1[0],$enarr1[0]);

  6. $cncharnum2        = preg_match_all("/[\xB0-\xF7][\xA1-\xFE]/", $str2,$zharr2);
  7. $ennum2                = preg_match_all("/[0-9a-zA-Z]+/", $str2,$enarr2);
  8. $newArray2        = array_merge($zharr2[0],$enarr2[0]);

  9. $num1        = count($newArray1);
  10. $num2        = count($newArray2);
  11. $num        = $num1<$num2?$num1:$num2;

  12. $result = array_intersect($newArray1, $newArray2);
  13. $va                = count($result)/$num*100;

  14. echo "相似度:".$va."%";
复制代码
http://bbs.chinaunix.net/viewthread.php?tid=625925
您需要登录后才可以回帖 登录 | 新猫注册

本版积分规则

手机版|小黑屋|[漫猫]动漫论坛

GMT+8, 2024-11-21 20:52

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表