哦,不!你不小心把一个长篇文章中的空格、标点都删掉了,并且大写也弄成了小写。像句子"I reset the computer. It still didn’t boot!“已经变成了"iresetthecomputeritstilldidntboot”。在处理标点符号和大小写之前,你得先把它断成词语。当然了,你有一本厚厚的词典dictionary,不过,有些词没在词典里。假设文章用sentence表示,设计一个算法,把文章断开,要求未识别的字符最少,返回未识别的字符数。
注意:本题相对原题稍作改动,只需返回未识别的字符数
题目链接:link.
寻求最优解问题,可以用动态规划,那状态方程是什么呢?
可以这样想:dp数组记录每个数当前位置的最少未识别字符,从前往后遍历,每遍历一个字母有两种可能(假设当前遍历到 i ):
然后从两个中选出最小的那一个即可
public static int respace(String[] dictionary, String sentence) {
Set<String> dict = new HashSet<>(Arrays.asList(dictionary));
int[] dp = new int[sentence.length()+1];
for (int i = 1; i <= sentence.length(); i++) {
dp[i] = dp[i-1] + 1;
for (int j = 0; j < i; j++) {
if(dict.contains(sentence.substring(j,i)))
// 选择两者最小的一个,这里不要break,因为后面可能还有更小的
dp[i] = Math.min(dp[j], dp[i]);
}
}
return dp[sentence.length()];
}