Làm cách nào để định dạng chuỗi JSON dưới dạng bảng bằng jq?


Chỉ mới bắt đầu với kịch bản Bash và tình cờ gặp jq để làm việc với JSON.

Tôi cần chuyển đổi một chuỗi JSON như bên dưới thành một bảng cho đầu ra trong thiết bị đầu cuối.

    "name": "George",
    "id": 12,
    "email": "george@domain.com"
}, {
    "name": "Jack",
    "id": 18,
    "email": "jack@domain.com"
}, {
    "name": "Joe",
    "id": 19,
    "email": "joe@domain.com"

Những gì tôi muốn hiển thị trong thiết bị đầu cuối:

ID        Name
12        George
18        Jack
19        Joe

Lưu ý rằng tôi không muốn hiển thị thuộc tính email cho mỗi hàng, vì vậy lệnh jq sẽ liên quan đến một số lọc. Phần sau cung cấp cho tôi một danh sách rõ ràng về tên và id:

list=$(echo "$data" | jq -r '.[] | .name, .id')
printf "$list"

Vấn đề với điều đó là, tôi không thể hiển thị nó như một bảng. Tôi biết jq có một số tùy chọn định dạng, nhưng gần như không tốt bằng các tùy chọn tôi có khi sử dụng printf. Tôi nghĩ rằng tôi muốn nhận các giá trị này trong một mảng mà sau đó tôi có thể tự lặp lại để thực hiện định dạng ...? Những điều tôi đã thử mang lại cho tôi nhiều kết quả khác nhau, nhưng không bao giờ là điều tôi thực sự muốn.

Ai đó có thể chỉ cho tôi đi đúng hướng?

Câu trả lời:


Tại sao không phải là một cái gì đó như:

echo '[{
    "name": "George",
    "id": 12,
    "email": "george@domain.com"
}, {
    "name": "Jack",
    "id": 18,
    "email": "jack@domain.com"
}, {
    "name": "Joe",
    "id": 19,
    "email": "joe@domain.com"
}]' | jq -r '.[] | "\(.id)\t\(.name)"'

Đầu ra

12  George
18  Jack
19  Joe

Chỉnh sửa 1: Để định dạng chi tiết tốt, hãy sử dụng các công cụ nhưawk

 echo '[{
    "name": "George",
    "id": 12,
    "email": "george@domain.com"
}, {
    "name": "Jack",
    "id": 18,
    "email": "jack@domain.com"
}, {
    "name": "Joe",
    "id": 19,
    "email": "joe@domain.com"
}]' | jq -r '.[] | [.id, .name] | @csv' | awk -v FS="," 'BEGIN{print "ID\tName";print "============"}{printf "%s\t%s%s",$1,$2,ORS}'
ID  Name
12  "George"
18  "Jack"
19  "Joe"

Chỉnh sửa 2: Trả lời

Không có cách nào tôi có thể lấy một biến chứa một mảng trực tiếp từ jq?

Tại sao không?

Một ví dụ có liên quan một chút (trên thực tế đã được sửa đổi từ của bạn) trong đó email được thay đổi thành một mảng thể hiện điều này

echo '[{
    "name": "George",
    "id": 20,
    "email": [ "george@domain1.com" , "george@domain2.com" ]
}, {
    "name": "Jack",
    "id": 18,
    "email": [ "jack@domain3.com" , "jack@domain5.com" ]
}, {
    "name": "Joe",
    "id": 19,
    "email": [ "joe@domain.com" ]
}]' | jq -r '.[] | .email'

Đầu ra


Cảm ơn về câu trả lời của bạn. Điều này hoạt động rất tốt trong trường hợp cụ thể này, các id đều có cùng độ dài. Hãy tưởng tượng tôi chuyển đổi thứ tự các trường, điều đó sẽ cho tôi thứ gì đó trông không giống một bảng tiện dụng chút nào. Tôi thực sự đang tìm kiếm một giải pháp mà tôi có thể sử dụng trên nhiều bộ dữ liệu hơn. Cảm ơn câu trả lời của bạn, mặc dù!

OK đã nhận nó. Không có cách nào tôi có thể lấy một biến chứa một mảng trực tiếp từ jq? Tôi luôn phải đi từ một chuỗi?

Cảm ơn sự giúp đỡ của bạn, đầu ra chính xác như tôi muốn (ngoại trừ các dấu ngoặc kép xung quanh tên). Thật kỳ lạ khi đi từ một chuỗi thay vì chuẩn bị sẵn sàng để sử dụng mảng như chúng ta làm trong Python chẳng hạn. Đối với tôi nó cảm thấy vụng về và bẩn thỉu, nhưng tôi đoán chỉ có tôi là phải làm quen với những ý tưởng về bash? Tôi sẽ cố gắng biến nó thành một hàm mà tôi có thể sử dụng lại, vì vậy tôi có thể sử dụng nó cho nhiều chuỗi JSON hơn với các tiêu đề khác nhau.

@Rein: để định dạng chi tiết, bạn cần in đầu ra ở định dạng csv và sau đó sử dụng awk, nhưng lưu ý rằng các trường hợp phức tạp có thể không thành công. Đối với nhận xét thứ hai của bạn, hãy xem bản chỉnh sửa cuối cùng và đọc nó cùng với câu trả lời [này] .

Cảm ơn vì liên kết và giải thích đó, siêu hữu ích!


Sử dụng @tsvbộ lọc có nhiều điều để khuyến khích, chủ yếu là vì nó xử lý nhiều "trường hợp cạnh" theo cách tiêu chuẩn:

.[] | [.id, .name] | @tsv

Việc thêm các tiêu đề có thể được thực hiện như sau:

jq -r '["ID","NAME"], ["--","------"], (.[] | [.id, .name]) | @tsv'

Kết quả:

--  ------
12  George
18  Jack
19  Joe


Để tự động hóa việc sản xuất dòng dấu gạch ngang:

jq -r '(["ID","NAME"] | (., map(length*"-"))), (.[] | [.id, .name]) | @tsv'

Bộ lọc @tsv thậm chí còn có trên trang hướng dẫn sử dụng bộ lọc cơ bản cho jq, hmm ... Tôi tự hỏi mình có thể đã bỏ lỡ điều gì nữa :)
Việc xác định tiêu đề bằng tay là không tối ưu! Việc bỏ qua tiêu đề cũng không tối ưu.


dữ liệu

[{ "name": "George", "id": 12, "email": "george@domain.com" },
{ "name": "Jack", "id": 18, "email": "jack@domain.com" }, 
{ "name": "Joe", "id": 19, "email": "joe@domain.com" }]

kịch bản

  [.[]| with_entries( .key |= ascii_downcase ) ]
      |    (.[0] |keys_unsorted | @tsv)
         , (.[]|.|map(.) |@tsv)

làm thế nào để chạy

$ < data jq -rf script  | column -t
name    id  email
George  12  george@domain.com
Jack    18  jack@domain.com
Joe     19  joe@domain.com

Tôi tìm thấy câu hỏi này trong khi tóm tắt một số dữ liệu từ các dịch vụ web của amazon. Vấn đề tôi đang giải quyết, trong trường hợp bạn muốn có một ví dụ khác:

$ aws ec2 describe-spot-instance-requests | tee /tmp/ins |
    jq  --raw-output '
                                     # extract instances as a flat list.
    [.SpotInstanceRequests | .[] 
                                     # remove unwanted data
    | { 
        statusCode: .Status.Code, 
        type: .LaunchSpecification.InstanceType, 
        blockPrice: .ActualBlockHourlyPrice, 
        created: .CreateTime, 
                                        # lowercase keys
                                        # (for predictable sorting, optional)
    |  [.[]| with_entries( .key |= ascii_downcase ) ]
        |    (.[0] |keys_unsorted | @tsv)               # print headers
           , (.[]|.|map(.) |@tsv)                       # print table
    ' | column -t

Đầu ra:

state      statuscode                   type     blockprice  created                   spotinstancerequestid
closed     instance-terminated-by-user  t3.nano  0.002000    2019-02-24T15:21:36.000Z  sir-r5bh7skq
cancelled  bad-parameters               t3.nano  0.002000    2019-02-24T14:51:47.000Z  sir-1k9s5h3m
closed     instance-terminated-by-user  t3.nano  0.002000    2019-02-24T14:55:26.000Z  sir-43x16b6n
cancelled  bad-parameters               t3.nano  0.002000    2019-02-24T14:29:23.000Z  sir-2jsh5brn
active     fulfilled                    t3.nano  0.002000    2019-02-24T15:37:26.000Z  sir-z1e9591m
cancelled  bad-parameters               t3.nano  0.002000    2019-02-24T14:33:42.000Z  sir-n7c15y5p

Đầu vào:

column -tđã thực hiện thủ thuật để căn chỉnh các tiêu đề với chính bảng. Cảm ơn!
Dimitris Moraitidis


Nếu các giá trị không chứa khoảng trắng, điều này có thể hữu ích:

read -r -a data <<<'name1 value1 name2 value2'

echo "name value"
echo "=========="

for ((i=0; i<${#data[@]}; i+=2)); do
  echo ${data[$i]} ${data[$((i+1))]}

Đầu ra

name value
name1 value1
name2 value2

Tôi bắt đầu nhận ra rằng tôi không thể lấy một mảng trực tiếp từ jq, có đúng không? Vì vậy, cách để đi là lấy một chuỗi từ nó (ở định dạng khả thi) và đi từ đó?
