Khái niệm về 'Không gian giữ' và 'Không gian mẫu' trong Sed

Question 1

Tôi bối rối bởi hai khái niệm trong sed: giữ không gian và không gian mẫu. Ai đó có thể giúp giải thích chúng?

Đây là một đoạn hướng dẫn sử dụng:

h H    Copy/append pattern space to hold space.
g G    Copy/append hold space to pattern space.

n N    Read/append the next line of input into the pattern space.

Sáu lệnh này thực sự làm tôi bối rối.

Question 2

Khi sed đọc một dòng tập tin bằng cách dòng, dòng đã được hiện đọc được đưa vào mô hình đệm (không gian mẫu). Bộ đệm mẫu giống như bộ đệm tạm thời, bàn di chuột nơi lưu trữ thông tin hiện tại. Khi bạn yêu cầu sed in, nó sẽ in bộ đệm mẫu.

Không gian lưu trữ / lưu trữ bộ đệm giống như một kho lưu trữ dài hạn, như vậy bạn có thể lấy một thứ gì đó, lưu trữ nó và sử dụng lại sau khi sed đang xử lý một dòng khác. Bạn không xử lý trực tiếp vùng lưu giữ, thay vào đó, bạn cần sao chép nó hoặc thêm vào vùng mẫu nếu bạn muốn làm gì đó với nó. Ví dụ, lệnh in chỉ pin khoảng trống mẫu. Tương tự như vậy, shoạt động trên không gian mẫu.

Đây là một ví dụ:

sed -n '1!G;h;$p'

(tùy chọn -n ngăn tự động in các dòng)

Có ba lệnh ở đây: 1!G, hvà $p. 1!Gcó một địa chỉ, 1(dòng đầu tiên), nhưng !có nghĩa là lệnh sẽ được thực thi ở mọi nơi trừ trên dòng đầu tiên. $pmặt khác sẽ chỉ được thực hiện ở dòng cuối cùng. Vậy điều gì xảy ra là:

dòng đầu tiên được đọc và tự động chèn vào không gian mẫu
trên dòng đầu tiên, lệnh đầu tiên không được thực hiện; hsao chép dòng đầu tiên vào không gian lưu giữ .
bây giờ dòng thứ hai thay thế bất cứ thứ gì trong không gian mẫu
trên dòng thứ hai, đầu tiên chúng ta thực thi G, nối nội dung của bộ đệm lưu vào bộ đệm mẫu, phân tách nó bằng một dòng mới. Không gian mẫu hiện chứa dòng thứ hai, dòng mới và dòng đầu tiên.
Sau đó, hlệnh chèn nội dung được ghép nối của vùng đệm mẫu vào vùng lưu giữ, hiện giữ các dòng đảo ngược hai và một.
Chúng ta tiếp tục đến dòng số ba - chuyển đến điểm (3) ở trên.

Cuối cùng, sau khi dòng cuối cùng đã được đọc và không gian lưu giữ (chứa tất cả các dòng trước đó theo thứ tự ngược lại) đã được thêm vào không gian mẫu, không gian mẫu được in với p. Như bạn đã đoán, phần trên thực hiện chính xác những gì taclệnh thực hiện - in ngược lại tệp.

Question 3

@Ed Morton: Tôi không đồng ý với bạn ở đây. Tôi thấy sedrất hữu ích và đơn giản (một khi bạn tìm hiểu khái niệm về mô hình và giữ bộ đệm) để tìm ra một cách thanh lịch để thực hiện chuyển đổi đa dòng.

Ví dụ, chúng ta hãy lấy một tệp văn bản có tên máy chủ và một số thông tin về mỗi máy chủ lưu trữ, với rất nhiều rác ở giữa mà tôi không quan tâm.

Host: foo1
some junk, doesnt matter
some junk, doesnt matter
Info: about foo1 that I really care about!!
some junk, doesnt matter
some junk, doesnt matter
Info: a second line about foo1 that I really care about!!
some junk, doesnt matter
some junk, doesnt matter
Host: foo2
some junk, doesnt matter
Info: about foo2 that I really care about!!
some junk, doesnt matter
some junk, doesnt matter

Đối với tôi, một tập lệnh awk để chỉ lấy các dòng có tên máy chủ và infodòng tương ứng sẽ mất nhiều hơn một chút so với những gì tôi có thể làm với sed:

sed -n '/Host:/{h}; /Info/{x;p;x;p;}' myfile.txt

đầu ra trông giống như:

Host: foo1
Info: about foo1 that I really care about!!
Host: foo1
Info: a second line about foo1 that I really care about!!
Host: foo2
Info: about foo2 that I really care about!!

(Lưu ý rằng nó Host: foo1xuất hiện hai lần trong đầu ra.)

Giải trình:

-n tắt đầu ra trừ khi được in rõ ràng
kết hợp đầu tiên, tìm và đặt Host:dòng vào bộ đệm giữ (h)
khớp thứ hai, tìm dòng Info: tiếp theo, nhưng trước tiên trao đổi (x) dòng hiện tại trong bộ đệm mẫu với bộ đệm giữ và in (p) Host:dòng, sau đó trao đổi lại (x) và in (p) dòng Info:.

Vâng, đây là một ví dụ đơn giản, nhưng tôi nghi ngờ đây là một vấn đề phổ biến đã được xử lý nhanh chóng bởi một lớp lót sed đơn giản. Đối với các nhiệm vụ phức tạp hơn nhiều, chẳng hạn như những nhiệm vụ mà bạn không thể dựa vào một trình tự nhất định, có thể dự đoán được, awk có thể phù hợp hơn.

Question 4

Mặc dù câu trả lời của @ January và ví dụ rất hay, nhưng với tôi lời giải thích vẫn chưa đủ. Tôi đã phải tìm kiếm và học hỏi rất nhiều cho đến khi tôi hiểu được cách thức sed -n '1!G;h;$p'hoạt động chính xác . Vì vậy, tôi muốn nói rõ hơn về lệnh cho một người như tôi.

Trước hết, chúng ta hãy xem lệnh làm gì.

$ echo {a..d} | tr ' ' '\n' # Prints from 'a' to 'd' in each line
a
b
c
d
$ echo {a..d} | tr ' ' '\n' | sed -n '1!G;h;$p'
d
c
b
a

Nó đảo ngược đầu vào giống như taclệnh.

sedđọc từng dòng, vì vậy hãy xem điều gì xảy ra trên khoảng trống vỗ và không gian giữ ở mỗi dòng. Khi hlệnh sao chép nội dung của không gian mẫu vào không gian lưu giữ, cả hai không gian đều có cùng văn bản.

Read line    Pattern Space / Hold Space    Command executed
-----------------------------------------------------------
a            a$                            h
b            b\na$                         1!G;h
c            c\nb\na$                      1!G;h
d            d\nc\nb\na$                   1!G;h;$p

Ở dòng cuối cùng, $pcác bản in d\nc\nb\na$được định dạng thành

d
c
b
a

Nếu bạn muốn xem không gian mẫu cho mỗi dòng, bạn có thể thêm một llệnh.

$ echo {a..d} | tr ' ' '\n' | sed -n '1!G;h;l;$p'
a$
b\na$
c\nb\na$
d\nc\nb\na$
d
c
b
a

Tôi thấy rất hữu ích khi xem video hướng dẫn này Hiểu cách hoạt động của sed , vì anh chàng chỉ ra cách từng không gian sẽ được sử dụng từng bước. Khoảng cách giữ được đề cập trong hướng dẫn thứ 4, nhưng tôi khuyên bạn nên xem tất cả các video nếu bạn chưa quen sed.

Ngoài ra tài liệu về GNU sed và hướng dẫn về Sed của Bruce Barnett là những tài liệu tham khảo rất tốt.