📌  相关文章
📜  如何使用正则表达式验证HTML标签

📅  最后修改于: 2021-04-23 06:27:49             🧑  作者: Mango

给定字符串str ,任务是使用正则表达式检查它是否为有效的HTML标记。
有效的HTML标记必须满足以下条件:

  1. 它应以一个开始标记(<)开头。
  2. 后面应加上双引号字符串或单引号字符串。
  3. 它不应允许一个双引号字符串,一个单引号字符串或一个不带单引号或双引号的结束标记(>)。
  4. 它应以结束标记(>)结尾。

例子:

方法:想法是使用正则表达式解决此问题。可以按照以下步骤计算答案。

  • 获取字符串。
  • 创建一个正则表达式来检查有效的HTML标记,如下所述:
  • 在哪里:
    • <表示字符串应以开始标签(<)开头。
    • (代表小组的开始。
    • “ [^”] *”表示该字符串应允许用双引号引起来的字符串。
    • |代表or。
    • ‘[^’] * ‘表示字符串应允许用单引号引起来的字符串。
    • |代表or。
    • [^’”>]表示字符串不应包含单引号,双引号和“>”。
    • )代表群组的结尾。
    • *表示0或更大。
    • >表示字符串应以结束标记(>)结尾。
  • 将给定的字符串与正则表达式匹配。在Java,这可以通过使用Pattern.matcher()来完成。
  • 如果字符串与给定的正则表达式匹配,则返回true;否则返回false。

下面是上述方法的实现:

C++
// C++ program to validate the
// HTML tag using Regular Expression
#include 
#include 
using namespace std;
 
// Function to validate the HTML tag.
bool isValidHTMLTag(string str)
{
 
  // Regex to check valid HTML tag.
  const regex pattern("<(\"[^\"]*\"|'[^']*'|[^'\">])*>");
 
  // If the HTML tag
  // is empty return false
  if (str.empty())
  {
     return false;
  }
 
  // Return true if the HTML tag
  // matched the ReGex
  if(regex_match(str, pattern))
  {
    return true;
  }
  else
  {
    return false;
  }
}
 
// Driver Code
int main()
{
   
  // Test Case 1:
  string str1 = "";
  cout << isValidHTMLTag(str1) << endl;
 
  // Test Case 2:
  string str2 = "
";   cout << isValidHTMLTag(str2) << endl;     // Test Case 3:   string str3 = "br/>";   cout << isValidHTMLTag(str3) << endl;     // Test Case 4:   string str4 = "<'br/>";   cout << isValidHTMLTag(str4) << endl;     // Test Case 5:   string str5 = " >";   cout << isValidHTMLTag(str5) << endl;     return 0; }   // This code is contributed by yuvraj_chandra


Java
// Java program to validate
// HTML tag using regex.
 
import java.util.regex.*;
 
class GFG {
 
    // Function to validate
    // HTML tag using regex.
    public static boolean
    isValidHTMLTag(String str)
    {
        // Regex to check valid HTML tag.
        String regex
            = "<(\"[^\"]*\"|'[^']*'|[^'\">])*>";
 
        // Compile the ReGex
        Pattern p = Pattern.compile(regex);
 
        // If the string is empty
        // return false
        if (str == null) {
            return false;
        }
 
        // Find match between given string
        // and regular expression
        // using Pattern.matcher()
        Matcher m = p.matcher(str);
 
        // Return if the string
        // matched the ReGex
        return m.matches();
    }
 
    // Driver Code.
    public static void main(String args[])
    {
 
        // Test Case 1:
        String str1 = "";
        System.out.println(isValidHTMLTag(str1));
 
        // Test Case 2:
        String str2 = "
";         System.out.println(isValidHTMLTag(str2));           // Test Case 3:         String str3 = "br/>";         System.out.println(isValidHTMLTag(str3));           // Test Case 4:         String str4 = "<'br/>";         System.out.println(isValidHTMLTag(str4));           // Test Case 5:         String str5 = " >";         System.out.println(isValidHTMLTag(str5));     } }


Python3
# Python3 program to validate
# HTML tag using regex.  
# using regular expression
import re
 
# Function to validate
# HTML tag using regex.
def isValidHTMLTag(str):
 
    # Regex to check valid
    # HTML tag using regex.
    regex = "<(\"[^\"]*\"|'[^']*'|[^'\">])*>"
     
    # Compile the ReGex
    p = re.compile(regex)
 
    # If the string is empty
    # return false
    if (str == None):
        return False
 
    # Return if the string
    # matched the ReGex
    if(re.search(p, str)):
        return True
    else:
        return False
 
# Driver code
 
# Test Case 1:
str1 = ""
print(isValidHTMLTag(str1))
 
# Test Case 2:
str2 = "
" print(isValidHTMLTag(str2))   # Test Case 3: str3 = "br/>" print(isValidHTMLTag(str3))   # Test Case 4: str4 = "<'br/>" print(isValidHTMLTag(str4))   # This code is contributed by avanitrachhadiya2155


输出:
true
true
false
false
false