티스토리 뷰

반응형

0. 개요

Notepad++는 텍스트 편집기로서 정규식(Regular Expressions)을 사용하여 특정한 문자열 패턴을 검색하거나 대체하는 등의 작업을 할 수 있습니다. 아래는 Notepad++에서 정규식을 사용하는 예시와 몇 가지 기본적인 패턴입니다.

1. 정규식으로 검색:

  • Ctrl + F 를 눌러 검색 창을 엽니다.
  • 아래의 "Find" 탭에서 "Regular expression" 옵션을 선택합니다.

2. 기본적인 패턴:

  • . : 어떤 문자 하나를 나타냅니다.
  • * : 앞의 문자가 0회 이상 반복됨을 나타냅니다.
  • + : 앞의 문자가 1회 이상 반복됨을 나타냅니다.
  • ? : 앞의 문자가 0회 또는 1회 등장함을 나타냅니다.

3. 예시:

  • a.b : "a" 다음에 어떤 문자 하나가 온 뒤 "b"가 나오는 패턴을 찾습니다. 예를 들어, "axb", "a2b" 등이 해당됩니다.
  • a.*b : "a" 다음에 어떤 문자들이 0회 이상 반복되고 "b"가 나오는 패턴을 찾습니다. "ab", "axyb", "a12345b" 등이 해당됩니다.
  • \d+ : 하나 이상의 숫자를 찾습니다.
  • [a-zA-Z] : 영문 알파벳 대소문자 중 하나를 찾습니다.
  • (word1|word2) : "word1" 또는 "word2"와 일치하는 패턴을 찾습니다.

4. 정규식으로 대체:

  • Ctrl + H 를 눌러 대체 창을 엽니다.
  • "Regular expression" 옵션을 선택합니다.
  • "Find what"에 정규식 패턴을 입력하고, "Replace with"에 바꿀 문자열을 입력합니다.
  • "Replace All" 버튼을 클릭하여 모든 해당 패턴을 대체합니다.

5. 활용예제

가. 이메일 주소 추출:

  • 목표: 텍스트 내의 이메일 주소를 모두 추출합니다.
  • 정규식: [A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,4}

나. URL 추출:

  • 목표: 텍스트 내의 URL을 모두 추출합니다.
  • 정규식: (https?|ftp):\/\/[^\s/$.?#].[^\s]*

다. 중복 공백 제거:

  • 목표: 연속된 공백을 하나의 공백으로 대체하여 공백을 정리합니다.
  • 정규식: \s+

라. 코드 주석 제거:

  • 목표: 주석을 제거하여 코드를 정리합니다.
  • 정규식: \/\/.*|\/\*[\s\S]*?\*\/

마. 전화번호 추출 및 형식 일관화:

  • 목표: 텍스트 내의 전화번호를 추출하고 표준 형식으로 변경합니다.
  • 정규식: (\d{3})[^\d]*(\d{3})[^\d]*(\d{4})
  • 대체 문자열: \1-\2-\3

바. 날짜 형식 일관화:

  • 목표: 다양한 날짜 형식을 표준 형식으로 변경합니다.
  • 정규식: (\d{1,2})[\/.-](\d{1,2})[\/.-](\d{4})
  • 대체 문자열: \3-\1-\2

사. HTML 태그 내용 추출:

  • 목표: HTML 태그 내용을 추출합니다.
  • 정규식: \<.*?\>

아. 큰 따옴표 내용 추출:

  • 목표: 큰 따옴표(")로 둘러싸인 내용을 추출합니다.
  • 정규식: \"(.*?)\"

자. 숫자와 알파벳 문자만 추출:

  • 목표: 숫자와 알파벳 문자만 추출합니다.
  • 정규식: [a-zA-Z0-9]+

차. 불필요한 공백 제거:

  • 목표: 문장의 시작과 끝에 있는 불필요한 공백을 제거합니다.
  • 정규식: ^\s+|\s+$
반응형