Computer >> 컴퓨터 >  >> 프로그램 작성 >> BASH 프로그래밍

Linux에서 awk 명령을 사용하는 방법 [예제 포함]

이 가이드는 많은 유용한 일상적인 예와 함께 Linux에서 awk 명령을 사용하는 방법을 보여줍니다.

어이쿠 Linux 운영 체제에서 사용할 수 있는 텍스트를 검색하고 조작하기 위한 도구 및 언어입니다.

아크 패턴으로 정의된 텍스트에 대한 명령어 및 관련 스크립팅 언어 검색 파일 특정 작업 수행 패턴과 일치하는 텍스트에.

으악 대용량 텍스트 파일 또는 많은 수의 텍스트 파일에서 데이터를 추출하고 보고서를 작성하는 데 유용한 도구입니다(예:처리 로그 또는 일정 기간 동안 많은 데이터를 수집한 온도 프로브와 같은 데이터 기록 장치의 출력) . 데이터베이스 쿼리의 출력에도 사용할 수 있습니다.

awk를 설치할 필요가 없습니다. Linux 시스템에서 이미 사용할 수 있어야 합니다.

awk 구문

awk 사용 구문 터미널의 명령은 다음과 같습니다.

awk [PROGRAM] [INPUT FILES]

참고:

  • [PROGRAM]은 검색 패턴과 수행할 작업입니다. awk가 제공된 파일에서 실행되기를 원하는 프로그램입니다.
    • -f를 사용하여 인라인이 아닌 텍스트 파일로 제공할 수도 있습니다. 옵션
  • [INPUT FILES]는 awk가 작업하기를 원하는 파일입니다. 공백으로 구분된 여러 파일, 디렉토리 경로 또는 일치시킬 파일 패턴이 될 수 있습니다.
    • 입력 파일이 지정되지 않은 경우 awk는 다른 명령의 파이프된 출력에서 ​​작동합니다.

awk 옵션

awk 명령에 다음 옵션을 제공할 수 있습니다.

<일>
-f 프로그램 파일 프로그램 텍스트는 명령줄 대신 파일에서 읽습니다. 여러 -f 옵션이 허용됩니다.
-F 값 필드 구분 기호 FS를 값으로 설정합니다.
-v var=값 프로그램 변수 var에 값을 할당합니다.

awk 버전에 대한 더 많은 구현별 옵션을 보려면 다음을 실행하여 설명서를 확인할 수 있습니다.

man awk

프로그램 작업 및 변수

awk에 제공하는 프로그램 당신이 그것에 제공하는 텍스트 파일에 무엇을 할 것인지 결정할 것입니다. awk 프로그램은 다음 형식을 취합니다.

CONDITION { ACTION }
CONDITION { ACTION }
...

CONDITION 위치 일치하는 텍스트의 패턴이며 ACTION 일치하는 텍스트에 대해 수행할 작업입니다. 원하는 만큼 많은 조건과 조치를 취할 수 있습니다.

작업

제공된 작업은 계산, 변수 및 호출 함수를 포함할 수 있는 명령입니다. 일부 내장 기능은 구현에 따라 다르므로 매뉴얼을 확인하는 것이 가장 좋습니다.

기록

으악 일반적으로 텍스트 파일의 각 줄을 레코드로 취급합니다. OPTIONS를 통해 달리 지정되지 않는 한 .

필드

으악 공백(공백, 탭)을 사용하여 필드를 나타냅니다. 기록에서 OPTIONS를 통해 달리 지정되지 않는 한 .

변수

으악 직접 정의하지 않고도 사용할 수 있는 내장 변수가 많이 있으며, 여기에는 몇 가지 일반적인 시나리오가 포함됩니다.

변수 의미
$0 전체 레코드를 나타냅니다.
$1, $2, $3 ... 필드 변수 – 레코드의 개별 텍스트 필드에 대한 텍스트/값 보유
NR / N R의 수 기록 현재까지 모든 파일에서 읽은 입력 레코드 수
FNR / F 파일 N R의 수 기록 현재 파일에서 지금까지 읽은 입력 레코드 수의 현재 카운트 – 새 파일이 시작될 때마다 자동으로 0으로 재설정
NF / N F의 수 필드 현재 입력 레코드의 필드 수 – 레코드의 마지막 필드는 $NF를 사용하여 참조할 수 있고, 두 번째에서 마지막 필드는 $(NF-1) 등을 사용하여 참조할 수 있습니다.
파일 이름 현재 입력 파일의 이름
FS / F 필드 S 구분자 레코드에서 필드를 구분하는 데 사용되는 문자. 기본적으로 공백 및 탭 문자가 포함됩니다.
RS / R 레코드 S 구분자 파일에서 레코드를 구분하는 데 사용되는 문자. 기본적으로 새 줄
OFS / O 출력 F 필드 S 구분자 Awk 출력에서 ​​필드를 구분하는 데 사용되는 문자입니다. 기본값은 단일 공백입니다.
ORS / O 출력 R 레코드 S 구분자 Awk 출력에서 ​​필드를 구분하는 데 사용되는 문자입니다. 기본값은 새 줄입니다.
OFMT / O 출력 F 또는 M T 숫자 출력 형식 – 기본 형식은 “%.6g”입니다.

awk 사용 예

이 예에서는 flowers.txt라는 단일 텍스트 파일로 작업합니다. , 다음 텍스트가 포함되어 있습니다.

red rose
yellow daffodil
pink flamingo
white rose
blue iris
white lily
red peony
yellow orchid
purple foxglove

파일 내용 인쇄

다음 awk 명령은 awk print를 사용하여 터미널에 파일 내용을 출력합니다. 기능:

awk '{print}' flowers.txt

파일의 레코드 수(줄) 인쇄

awk 'END { print NR }' sample.txt

이 예는 파일의 줄 수를 출력합니다:

9

정규 표현식을 사용하여 파일에서 텍스트 검색

다음 명령은 장미 유형만 설명하는 줄을 파일에 출력합니다. :

awk '/rose/' flowers.txt

참고 REGEX (정규식) 구문은 검색할 텍스트를 정의하는 데 사용됩니다.

이 명령은 다음을 출력합니다.

red rose
white rose

정규 표현식 더보기

awk '/^p/' flowers.txt

이 명령어는 p로 시작하는 레코드만 출력합니다. :

pink flamingo
purple foxglove

필드 변수 사용

필드 변수를 사용하여 , p로 시작하는 레코드의 첫 번째 필드만 출력할 수 있습니다. :

awk '/^p/ {print $1;}' flowers.txt

출력:

pink
purple

다른 프로그램의 출력 처리

파이프할 수 있습니다. 다른 Linux 셸 프로그램에서 awk로 출력 처리를 위해. 이 예는 ls -l에서 출력을 가져옵니다. 현재 디렉토리의 내용을 나열하고 5번째의 내용을 반환하는 명령어 필드(파일 크기):

ls -l | awk '{print $5}'

다음과 같이 출력됩니다.

3104
3072
224
256

...(현재 디렉토리에 있는 파일 수와 파일 크기에 따라 다름).

내장 변수 사용

awk '{print NR "-" $2 }' flowers.txt

이 명령은 현재 레코드 번호(파일 줄 번호) 다음에 두 번째 필드인 꽃 이름을 인쇄합니다.

1-red rose
2-yellow daffodil
3-pink flamingo
4-white rose
5-blue iris
6-white lily
7-red peony
8-yellow orchid
9-purple foxglove

동작 결합

조건 및 작업 &&를 사용하여 결합할 수 있습니다. 이 명령은 첫 번째 필드에 텍스트 red가 포함된 모든 레코드를 인쇄합니다. 두 번째 필드에 5자 미만이 있습니다. :

awk '$1 ~ /red/ && length($NF) < 5 { print }' flowers.txt

참고:

  • $NF 사용 $2를 사용하는 대신 두 번째 필드로 이동 – 마지막 필드이므로 NF(Number of Fields)와 동일하므로 가능
  • 길이() 함수는 필드의 길이를 계산하는 데 사용됩니다.

따라서 예제 파일에서 일치하는 단일 레코드를 반환합니다.

red rose

결론

으악 Linux에 거의 보편적으로 포함된 이유는 텍스트 검색 및 처리를 위한 주요 도구로, 시스템에 문제가 있는 경우 로그 항목을 빠르게 찾거나 연구용으로 캡처한 데이터를 처리하는 데 사용할 수 있습니다.

대규모 텍스트 파일 모음에서 단순한 찾기/바꾸기 이상의 작업을 시도한 적이 있다면 실행하지 않고도 프로그래밍 방식으로 모든 텍스트를 구체적으로 대체하거나 업데이트할 수 있다는 가치를 알게 될 것입니다. 개별 찾기/바꾸기 명령.

다른 Linux 팁을 확인하십시오!