去落格博客阅读完整排版的在字符串中 快速查找
很多时候,我们需要在字符串中执行查找,以判断过滤指定的内容出来。比如过在落格输入法当中,就需要用辅码过滤出需要的候选词。
一般来说,查找和对比肯定是数字来的最快,不过在词库上总不能把所有的词汇都转换为数字(虽然理论上可行……)在字符串的搜索上,我们有很多种办法来实现,这里我就说一下我自己的思路:
由于我的词库辅码筛选只对两字或者三字词汇生效,那么我考虑把它们作为集合(Set)来检测,把词汇拆成单字。很遗憾,不说拆分的单独开销,本以为哈希表的set集合会很快,但速度并不行,可能它的优势是在于大量的时候吧,不过很可惜,它的速度是最慢的。
我用一个简短的集合来多次遍历然后统计时间,得到结果如下:
let ptime = Date().timeIntervalSince1970 let b:Set<String> = ["a","b","c","d","e","f","g","h"] for _ in (0...9999999) { _=b.contains("hb") } let during = Date().timeIntervalSince1970 - ptime print(during)
结果
8.90186786651611值得一提的是,无论是命中还是丢失,速度是一样的。当然,速度慢也得考虑字符串比较自身的开销问题。
字符串自带了包含方法,它可以检测字符串
a中是否包含了
"a",如果包含了,就返回
true。这是很直接的办法:
let a = "abcdefgh" let ptime = Date().timeIntervalSince1970 for _ in (0...9999999) { a.contains("a") } let during = Date().timeIntervalSince1970 - ptime print(during)
用这样简单的遍历得到结果
7.06464505195618秒。
那么能不能更快一些呢?我们换一种思路,如果说我们仅仅是查找,那其实还有一种方法可以考虑,那就是
Swift 中
String还有一个自带的方案,那就是获取指定字符串在另一字符串的范围,用来提取活着修改字符串用,如果找不到,那么就返回
nil。
这里我们用返回值是否为空来判断字符串是否包含,速度会是多少呢?
let a = "abcdefgh" let ptime = Date().timeIntervalSince1970 for _ in (0...9999999) { _ = a.range(of: "ah") } let during = Date().timeIntervalSince1970 - ptime print(during)
执行的结果是
6.38309478759766秒。显然,这种方法的查找速度是比上边两种专门的查找要快的。
range丢失时也比 Set 要快;
在字符串中 快速查找,首发于落格博客。