• s2最少删除多少字符可以成为s1的子串


    问题描述

            给定两个字符串s1和s2,问s2最少删除多少字符可以成为s1的子串?比如 s1 = "abcde",s2 = "axbc"返回1。s2删掉'x'就是s1的子串了。

    思路

    思路一:

            求str2所有的子序列,然后按照长度排序,长度大的排在前面,然后考察那个子序列字符串和str1的某个子串相同(KMP算法)。

            这种算法要求样本数据中str2的长度很小。如果str1的长度远远小于str2的长度这种思想就不合适了。这是因为:若str1长度为N,str2的长度为M,str2的子序列的个数为2^M个,KMP算法的时间复杂度为O(n),综上算法整体的时间复杂度为:O(2^M*N)。若2^M*N的数值小于10^8(10^8:在用java解题时一般要求在2-3秒内,这个时间段的数值大小一般在10^8-10^9之间)即可以使用该思想解题。

    思路二:

            生成所有的str1的子串,然后考察每个子串和str2的编辑距离(假设编辑距离只有删除动作且删除每一个字符的代价为1。编辑距离可以参考:返回将str1编辑成str2的最小代价_朂後 哋箹萣的博客-CSDN博客)。

           每一个str1的子串都会与str2生成一个dp的二维数组。dp[i][j]行用str2的长度表示,列用str1的子串的长度表示。dp[i][j]的含义是:str2[0...i]仅通过删除行为变为str1的子串的最小代价。

           dp[0][0]的值是判断str2的第一个字符是否与str1的最小子字符串(只有一个字符)一样,一样则是0,不一样则保存系统最大值。

            dp[0][j]表示str2只有第一个字符,str1的子串不是最小子字符串,str2不可能通过删除字符的形式转化为str1,所以这一行全部存入系统最大值。

            dp[i][0]表示str1最小子字符串,str2不止一个字符。这种情况是有可能实现的,只需要查看str2的全部字符中是否存在str1最小子字符串(只有一个字符)即可。

            对于任意的dp[i][j]有两种可能性(s1sub[]是str1[]的子串):

    • str2[0..i]变的过程中,不保留最后一个字符(str2[i)。那么就是通过str2[0...i-1]变成s1sub[0...j]之后,再删除str2[i]即可:dp[i][j] = dp[i - 1][j] + 1。
    • str2[0...i]变得过程中,想保留最后一个字符(str2[i]),然后变成s1sub[0...j],这就要求str2[i] == s1sub[j]才有可能,然后str2[0...i-1]变成s1sub[0...j-1]即可,也就是dp[i][j]=dp[i - 1][j - 1]。

            若str1长度为N,str2长度为M。str1生成子串时间复杂度为:O(N^2),遍历生成的dp二维表时间复杂度为O(N*M),综上算法的时间复杂度为:O(N^3*M)。

            如果str1的长度比较小,str2的长度比较大这个方法也适用。

    思路三:

            在思路二的基础上,进行改进。思想二每一个str1的子串都会与str2生成一个dp的二维数组,我们会发现str1的子串只要是开头字符相同的字符串由长到短,只需要dp二维数组右边加一行即可,上面的二维数组的数据是不改变的。根据这一思想,算法的时间复杂度由原来的的O(N^3*M)转变为了O(N^2*M)。

            在实际的题目中我们可以根据题目中给定的str1和str2的长度计算2^M*N和N^2*M,进而选择合适的算法解题。

    代码

    思想一代码:

    1. public static int minCost1(String s1, String s2) {
    2. List s2Subs = new ArrayList<>();
    3. process(s2.toCharArray(), 0, "", s2Subs);
    4. s2Subs.sort(new LenComp());
    5. for (String str : s2Subs) {
    6. if (s1.indexOf(str) != -1) {
    7. return s2.length() - str.length();
    8. }
    9. }
    10. return s2.length();
    11. }
    12. public static void process(char[] str2, int index, String path, List list) {
    13. if (index == str2.length) {
    14. list.add(path);
    15. return;
    16. }
    17. process(str2, index + 1, path, list);
    18. process(str2, index + 1, path + str2[index], list);
    19. }
    20. public static class LenComp implements Comparator {
    21. @Override
    22. public int compare(String o1, String o2) {
    23. return o2.length() - o1.length();
    24. }
    25. }

    思想二代码:

    1. public static int minCost2(String s1, String s2) {
    2. if (s1.length() == 0 || s2.length() == 0) {
    3. return s2.length();
    4. }
    5. int ans = Integer.MAX_VALUE;
    6. char[] str2 = s2.toCharArray();
    7. for (int start = 0; start < s1.length(); start++) {
    8. for (int end = start+1; end <= s1.length(); end++) {
    9. char[] s1sub = s1.substring(start, end).toCharArray();
    10. ans = Math.min(ans, distance(str2, s1sub));
    11. }
    12. }
    13. return ans;
    14. }
    15. public static int distance(char[] str2, char[] s1sub) {
    16. int row = str2.length;
    17. int col = s1sub.length;
    18. int[][] dp = new int[row][col];
    19. dp[0][0] = str2[0] == s1sub[0] ? 0 : Integer.MAX_VALUE;
    20. for (int j = 1; j < col; j++) {
    21. dp[0][j] = Integer.MAX_VALUE;
    22. }
    23. for (int i = 1; i < row; i++) {
    24. dp[i][0] = (dp[i - 1][0] != Integer.MAX_VALUE || str2[i] == s1sub[0]) ? i : Integer.MAX_VALUE;
    25. }
    26. for (int i = 1; i < row; i++) {
    27. for (int j = 1; j < col; j++) {
    28. dp[i][j] = Integer.MAX_VALUE;
    29. if (dp[i - 1][j] != Integer.MAX_VALUE) {
    30. dp[i][j] = dp[i - 1][j] + 1;
    31. }
    32. if (str2[i] == s1sub[j] && dp[i - 1][j - 1] != Integer.MAX_VALUE) {
    33. dp[i][j] = Math.min(dp[i][j], dp[i - 1][j - 1]);
    34. }
    35. }
    36. }
    37. return dp[row - 1][col - 1];
    38. }

    思想三代码:

    1. public static int minCost3(String s1, String s2) {
    2. if (s1.length() == 0 || s2.length() == 0) {
    3. return s2.length();
    4. }
    5. char[] str2 = s2.toCharArray();
    6. char[] str1 = s1.toCharArray();
    7. int M = str2.length;
    8. int N = str1.length;
    9. int[][] dp = new int[M][N];
    10. int ans = M;
    11. for (int start = 0; start < N; start++) {
    12. dp[0][start] = str2[0] == str1[start] ? 0 : M;
    13. for (int row = 1; row < M; row++) {
    14. dp[row][start] = (str2[row] == str1[start] || dp[row - 1][start] != M) ? row : M;
    15. }
    16. ans = Math.min(ans, dp[M - 1][start]);
    17. for (int end = start + 1; end < N && end - start < M; end++) {
    18. int first = end - start;
    19. dp[first][end] = (str2[first] == str1[end] && dp[first - 1][end - 1] != M) ? 0 : M;
    20. for (int row = first + 1; row < M; row++) {
    21. dp[row][end] = M;
    22. if (dp[row - 1][end] != M) {
    23. dp[row][end] = dp[row - 1][end] + 1;
    24. }
    25. if (dp[row - 1][end - 1] != M && str2[row] == str1[end]) {
    26. dp[row][end] = Math.min(dp[row][end], dp[row - 1][end - 1]);
    27. }
    28. }
    29. ans = Math.min(ans, dp[M - 1][end]);
    30. }
    31. }
    32. return ans;
    33. }
    34. public static String generateRandomString(int l, int v) {
    35. int len = (int) (Math.random() * l);
    36. char[] str = new char[len];
    37. for (int i = 0; i < len; i++) {
    38. str[i] = (char) ('a' + (int) (Math.random() * v));
    39. }
    40. return String.valueOf(str);
    41. }
    42. public static void main(String[] args) {
    43. int str1Len = 20;
    44. int str2Len = 10;
    45. int v = 5;
    46. int testTime = 100;
    47. boolean pass = true;
    48. System.out.println("test begin");
    49. for (int i = 0; i < 1; i++) {
    50. String str1 = generateRandomString(str1Len, v);
    51. String str2 = generateRandomString(str2Len, v);
    52. int ans1 = minCost1(str1, str2);
    53. int ans2 = minCost2(str1, str2);
    54. int ans3 = minCost3(str1, str2);
    55. if ( ans1 != ans3 || ans2 != ans3) {
    56. pass = false;
    57. System.out.println(str1);
    58. System.out.println(str2);
    59. System.out.println(ans1);
    60. System.out.println(ans2);
    61. System.out.println(ans3);
    62. break;
    63. }
    64. }
    65. System.out.println("test pass : " + pass);
    66. }

  • 相关阅读:
    java计算机毕业设计高校招生管理系统MyBatis+系统+LW文档+源码+调试部署
    prometheus之监控keepalived
    java性能优化总结
    安装虚拟机找不到虚拟网啦1(eth1)不出现
    【小沐学Python】Python实现在线电子书(MkDocs + readthedocs + github + Markdown)
    孪生神经网络
    软件测试笔试题总结
    windows上传文件到linux的方法
    Ps:快速蒙版
    120.三角形最小路径和
  • 原文地址:https://blog.csdn.net/z1171127310/article/details/127834840