• 【剑指Offer】19.正则表达式匹配


    题目

    请实现一个函数用来匹配包括'.'和'*'的正则表达式

    1.模式中的字符'.'表示任意一个字符

    2.模式中的字符'*'表示它前面的字符可以出现任意次(包含0次)。

    在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但是与"aa.a"和"ab*a"均不匹配

    数据范围:

    1.str 只包含从 a-z 的小写字母。

    2.pattern 只包含从 a-z 的小写字母以及字符 . 和 *,无连续的 '*'。

    3. 0≤str.length≤26 

    4. 0≤pattern.length≤26 

    示例1

    输入:"aaa","a*a"

    返回值:true

    说明:中间的*可以出现任意次的a,所以可以出现1次a,能匹配上

    示例2

    输入:"aad","c*a*d"

    返回值:true

    说明:因为这里 c 为 0 个,a被重复一次, * 表示零个或多个a。因此可以匹配字符串 "aad"。

    示例3

    输入:"a",".*"

    返回值:true

    说明:".*" 表示可匹配零个或多个('*')任意字符('.')

    示例4

    输入:"aaab","a*a*a*c"

    返回值:false

    解答

    源代码

    1. import java.util.*;
    2. public class Solution {
    3. /**
    4. * 代码中的类名、方法名、参数名已经指定,请勿修改,直接返回方法规定的值即可
    5. *
    6. *
    7. * @param str string字符串
    8. * @param pattern string字符串
    9. * @return bool布尔型
    10. */
    11. public boolean match (String str, String pattern) {
    12. // write code here
    13. int m = str.length();
    14. int n = pattern.length();
    15. boolean[][] dp = new boolean[m + 1][n + 1];
    16. for (int i = 0; i <= m; i++) {
    17. for (int j = 0; j <= n; j++) {
    18. if (j == 0) {
    19. if (i == 0) {
    20. dp[i][j] = true;
    21. }
    22. } else {
    23. if (pattern.charAt(j - 1) == '*') {
    24. // 不和字符串进行匹配
    25. if (j >= 2) {
    26. dp[i][j] |= dp[i][j - 2];
    27. }
    28. // 和字符串进行匹配
    29. if (i > 0 && j >= 2 && (str.charAt(i - 1) == pattern.charAt(j - 2) || pattern.charAt(j - 2) == '.')) {
    30. dp[i][j] |= dp[i - 1][j];
    31. }
    32. } else {
    33. if (i > 0 && (str.charAt(i - 1) == pattern.charAt(j- 1) || pattern.charAt(j - 1) == '.')) {
    34. dp[i][j] = dp[i - 1][j - 1];
    35. }
    36. }
    37. }
    38. }
    39. }
    40. return dp[m][n];
    41. }
    42. }

    总结

    动态规划

    假设主串为 str,模式串为 pattern 从最后一步出发,需要关注最后进来的字符。假设 str 的长度为 n ,pattern的长度为 m ,关注正则表达式 pattern的最后一个字符是谁,它有三种可能,正常字符、'*' 和 '.'(点),那针对这三种情况讨论即可,如下:

    1、如果 pattern的最后一个字符是正常字符,那就是看str[n−1] 是否等于 pattern[m−1],相等则看str [0..n−2]与 pattern [0..m−2],不等则是不能匹配,这就是子问题。

    2、如果 pattern 的最后一个字符是 ‘.’,它能匹配任意字符,直接看 str [0..n−2]与 pattern [0..m−2]

    3、如果 pattern 的最后一个字符是‘*’,它代表 pattern[m-2]=c 可以重复0次或多次,它们是一个整体 c*

    情况一:str[n-1] 是 0 个 c,pattern最后两个字符废了,能否匹配取决于 str [0..n−1]和 pattern [0..m−3]是否匹配

    情况二:str[n-1] 是多个 c 中的最后一个(这种情况必须 str[n-1]=c 或者 c='.'),所以str 匹配完往前挪一个,pattern  继续匹配,因为可以匹配多个,继续看str[0..n−2]和 pattern[0..m−1]是否匹配。

    dp[i][j] 代表 str 的前 i 个和 pattern 的前 j 个能否匹配。对于前面两个情况,可以合并成一种情况 dp[i][j]=dp[i−1][j−1];对于第三种情况,对于 c* 分为看和不看两种情况:不看:直接砍掉正则串pattern 的后面两个, dp[i][j]=dp[i][j−2];看:正则串pattern 不动,主串str前移一个,dp[i][j]=dp[i−1][j]。

    特判:需要考虑空串空正则

    空串和空正则是匹配的,dp[0][0]=true。

    空串和非空正则,不能直接定义 true 和 false,必须要计算出来。(比如str= '' '' ,pattern=a*b*c*)

    非空串和空正则必不匹配,dp[1][0]=...=dp[n][0]=false

    非空串和非空正则,那肯定是需要计算的了。

    大体上可以分为空正则和非空正则两种,空正则也是比较好处理的,对非空正则我们肯定需要计算,非空正则的三种情况,前面两种可以合并到一起讨论,第三种情况是单独一种,那么也就是分为当前位置是 '*' 和不是 '*' 两种情况了。

  • 相关阅读:
    spring面试常遇见的问题(01)
    个人网站的SEO优化系列——如何实现搜索引擎的收录
    mybatis第一次课
    Python的单元测试之unittest
    应用没“积分”,系统就不让运行?Android 13部分功能曝光
    Oracle for Windows安装和配置——Oracle for Windows数据库创建及测试
    java.util.Date在json的格式化上的研究与成果
    【云原生】DevOps(五):集成Harbor
    LeetCode每日一题(1012. Numbers With Repeated Digits)
    Mysql 45讲学习笔记(三十六)临时表
  • 原文地址:https://blog.csdn.net/qq_57438473/article/details/133806933