Mã Morse là nhị phân, ternary hay quinary?


27

Tôi đang đọc cuốn sách: " Mã: Ngôn ngữ ẩn của phần cứng và phần mềm máy tính " và trong Chương 2, tác giả nói:

Mã Morse được gọi là mã nhị phân (nghĩa đen là hai nhân hai) bởi vì các thành phần của mã chỉ bao gồm hai thứ - dấu chấm và dấu gạch ngang.

Wikipedia mặt khác nói:

Nói đúng ra, nó không phải là nhị phân, vì có năm yếu tố cơ bản (xem phần phụ). Tuy nhiên, điều này không có nghĩa là mã Morse không thể được biểu diễn dưới dạng mã nhị phân. Theo một nghĩa trừu tượng, đây là chức năng mà các nhà khai thác điện báo thực hiện khi truyền tin nhắn (xem quinary).

Nhưng một lần nữa, một trang Wikipedia khác lại bao gồm Mã Morse trong 'Danh sách mã nhị phân'.

Tôi rất bối rối bởi vì tôi sẽ nghĩ rằng Mã Morse thực sự là ternary . Bạn có 3 loại 'khả năng' khác nhau: im lặng, tiếng bíp ngắn hoặc tiếng bíp dài.

Không thể đại diện cho Mã Morse trong 'stirct binary' phải không?

Ý tôi là 'nhị phân nghiêm ngặt', nghĩ về dòng nhị phân: 1010111101010 .. Làm thế nào tôi có thể đại diện cho một khoảng lặng, tiếng bíp ngắn và / hoặc tiếng bíp dài?

Cách duy nhất tôi có thể nghĩ là 'cỡ chữ' mà máy tính thực hiện. Nếu tôi (và CPU / trình thông dịch của mã) biết rằng nó sẽ đọc 8 bit mỗi lần, thì tôi có thể đại diện cho Mã Morse. Tôi chỉ có thể biểu thị một tiếng bíp ngắn bằng 1 hoặc một tiếng bíp dài bằng 0 và các khoảng lặng sẽ được biểu thị ngầm bằng độ dài từ. (Giả sử 8 bit ..) Vì vậy, một lần nữa, tôi có biến thứ 3 / tài sản thứ 3 này bàn tay của tôi: kích thước từ.

Suy nghĩ của tôi là như thế này: Tôi có thể dự trữ 3 bit đầu tiên để đọc bao nhiêu bit và 5 bit cuối cho mã Morse trong một từ 8 bit. Giống như 00110000 sẽ có nghĩa là 'A'. Và tôi vẫn còn trong 'nhị phân' NHƯNG tôi cần kích thước từ khiến cho nó không đúng không? 3 bit đầu tiên cho biết: Chỉ đọc 1 bit từ 5 bit sau.

Thay vì nhị phân, nếu chúng ta sử dụng nhị phân, chúng ta có thể hiển thị mã morse như: 101021110102110222 vv .. trong đó 1 là: dit 0 là: dah và 2 là im lặng. Bằng cách sử dụng 222, chúng tôi có thể mã hóa khoảng im lặng dài, vì vậy nếu bạn có tín hiệu như * - * --- * - bạn có thể hiển thị nó như sau: 102100022210, nhưng không thể trực tiếp sử dụng chỉ với 1 và 0 KHÔNG GIỚI HẠN mà bạn nghĩ ra một cái gì đó giống như kích thước từ 'cố định' như tôi đã đề cập, nhưng đây cũng là cách diễn giải, không lưu Mã Morse như ở dạng nhị phân. Hãy tưởng tượng một cái gì đó giống như một cây đàn piano, bạn chỉ có các nút đàn piano. Bạn muốn để lại một tin nhắn trong Mã Morse cho ai đó và bạn có thể sơn các nút thành màu đen. Không có cách nào bạn có thể để lại một tin nhắn rõ ràng, phải không? Bạn cần ít nhất một màu nữa để bạn có thể đặt các khoảng lặng (những màu giữa các ký tự và từ. Đây là những gì tôi muốn nói bởi trenary.

Tôi không hỏi liệu bạn có thể đại diện cho Mã Morse trong 57-ary hay bất cứ điều gì khác không.

Tôi đã gửi e-mail cho tác giả (Charles Petzold) về điều này; ông nói rằng ông chứng minh trong Chương 9 của "Mã" rằng Mã Morse có thể được hiểu là mã nhị phân.

Tôi sai ở đâu với suy nghĩ của mình? Có phải những gì tôi đang đọc trong cuốn sách, rằng Mã Morse có phải là Nhị phân hay không? Có phải nó bằng cách nào đó gây tranh cãi? Tại sao Mã Morse được nói là số ít trong một trang Wikipedia và nó cũng được liệt kê trong trang Danh sách mã nhị phân ?

Chỉnh sửa: Tôi đã gửi email cho tác giả và nhận được trả lời:

----- Tin nhắn gốc -----

Từ: Koray Tugay [mailto: koray@tugay.biz]

Đã gửi: Thứ ba, ngày 3 tháng 3 năm 2015 3:16 chiều

Tới: cp@charlespetzold.com

Chủ đề: Mã Morse có thực sự là nhị phân không?

Thưa ông, ông có thể xem câu hỏi của tôi ở đây: Mã Morse nhị phân, ternary hay quinary? quẻ?

Trân trọng, Koray Tugay

Từ: "Charles Petzold"

Tới: "'Koray Tugay'"

Chủ đề: RE: Mã Morse có thực sự là nhị phân không? Ngày: 3

Tháng 3 năm 2015 23:04:35 EET

Đến cuối Chương 9 trong "Mã" tôi chứng minh rằng Mã Morse có thể được hiểu là mã nhị phân.

----- Tin nhắn gốc -----

Từ: Koray Tugay [mailto: koray@tugay.biz]

Đã gửi: Thứ ba, ngày 3 tháng 3 năm 2015 3:16 chiều

Tới: cp@charlespetzold.com

Chủ đề: Mã Morse có thực sự là nhị phân không?

Thưa ông, ông có thể xem câu hỏi của tôi ở đây: Mã Morse nhị phân, ternary hay quinary? quẻ?

Trân trọng, Koray Tugay

Tôi không giấu e-mail của anh ấy vì nó thực sự dễ dàng tìm thấy trên web.


Vui lòng chuyển bất kỳ cuộc trò chuyện nào nữa sang chat.stackexchange.com/rooms/21638/ từ
Logic lang thang

Bình luận không dành cho thảo luận mở rộng; cuộc trò chuyện này đã được chuyển sang trò chuyện .
Raphael

Tôi đã sửa các liên kết tôi vô tình xóa (rất tiếc); xin vui lòng kiềm chế từ bất kỳ trở lại để sửa đổi tồi tệ hơn.
Raphael

1
@WanderingLogic Cách tiếp cận chính xác, hiệu quả nhất và không có tiếng ồn là âm thầm gắn cờ câu hỏi để dọn dẹp bình luận và đề nghị các bình luận được chuyển sang trò chuyện trong cờ, không chơi cảnh sát bình luận và cố gắng tạo một phòng trò chuyện để kết hợp tất cả các bình luận trên tất cả các câu trả lời không có ngữ cảnh. Liên kết của bạn bây giờ cũng chỉ gây nhầm lẫn vấn đề vì Raphael đã đăng liên kết chính xác.
Jason C

1
@ J.-E.Pin Vâng, tôi đã không đưa ra một định nghĩa chính thức bởi vì tôi đã cho rằng mọi người trả lời câu hỏi sẽ biết điều đó, và tôi đã có một hoặc hai tham chiếu đến wikipedia để đặt bối cảnh. Ngay cả khi wikipedia có thể không hoàn hảo, điều này sẽ có thể đảm nhận vai trò của các định nghĩa, như thường được thực hiện ở đây. Phải mất một thời gian tôi mới nhận ra rằng đó là vấn đề, thực sự rõ ràng là phổ biến. Tôi đã là chính mình trong quá trình viết lại tất cả, với các định nghĩa rõ ràng, trích dẫn, tài liệu tham khảo và giải thích chính thức với sự đồng hình tiêm. Tôi có nên hoàn thành?
babou

Câu trả lời:


19

Mã Morse là mã ternary tiền tố (để mã hóa 58 ký tự) bên trên mã nhị phân tiền tố mã hóa ba ký hiệu.

Đây là một câu trả lời ngắn hơn nhiều khi được chấp nhận. Tuy nhiên, xem xét những hiểu lầm đáng kể giữa người dùng và làm theo yêu cầu từ OP, tôi đã viết câu trả lời dài hơn nhiều này. Phần "tóm tắt" đầu tiên cung cấp cho bạn ý chính của nó.

Nội dung

Tóm lại (lớn)

Khi hỏi "Mã Morse là nhị phân, ternary hay quinary?" không có so sánh các câu trả lời có thể trừ khi người ta sửa một số tiêu chí cho một câu trả lời chấp nhận được. Thật vậy, không có tiêu chí phù hợp, người ta có thể giải thích cho gần như bất kỳ loại cấu trúc nào. Các tiêu chí tôi đã chọn là như sau:

  • nó sẽ phản ánh mô tả ba tầng của mã Morse với biểu diễn dấu chấm / dấu gạch ngang trong tầng thứ hai;

  • nó phải phù hợp với việc trình bày và các công cụ toán học được phát triển để phân tích lý thuyết mã, càng nhiều càng tốt;

  • nó nên đơn giản nhất có thể;

  • cần làm rõ các thuộc tính của mã Morse.

Điều này nhằm ngăn chặn việc hack tùy tiện, mà bỏ qua các khái niệm cơ bản của lý thuyết mã như được nghiên cứu một cách khoa học, và có thể có một sự hấp dẫn bằng cách đưa ra một ảo tưởng về phân tích hệ thống, mặc dù được đề cập quá không chính thức để kết luận. Trang web này được cho là về khoa học máy tính , không phải lập trình. Chúng ta nên sử dụng tối thiểu các khái niệm khoa học đã được thiết lập và chấp nhận để trả lời một câu hỏi kỹ thuật.

Một phân tích nhanh về tiêu chuẩn cho thấy rằng tất cả các ký hiệu được sử dụng trong mã Morse cuối cùng được mã hóa thành nhị phân , vì nó được truyền dưới dạng một chuỗi các đơn vị có độ dài bằng nhau, với tín hiệu có thể bật hoặc tắt cho mỗi đơn vị. Điều này chỉ ra rằng các thông điệp Morse cuối cùng được mã hóa theo bảng chữ cái logic .Σ1={0,1}

Nhưng điều đó không nói gì về cấu trúc bên trong của mã. Thông tin được mã hóa là một chuỗi trên bảng chữ cái gồm 58 ký hiệu (theo tiêu chuẩn) bao gồm 57 ký tự và khoảng trắng. Điều này tương ứng với một bảng chữ cái , biểu tượng cuối cùng là không gian.Σ3={A,B,,Z,0,1,,9,?,=,,×,@,[]}

Tuy nhiên, các quy định cụ thể tiêu chuẩn mà có một bảng chữ cái trung gian , dựa trên và và có thể là biểu tượng khác. Nó khá rõ ràngΣ2dotdash

  • các chuỗi trong sẽ được mã hóa thành các chuỗi trong và Σ * 2Σ3Σ2

  • các chuỗi trong phải được mã hóa thành các chuỗi trong Σ * 1Σ2Σ1

Vì vậy, do không có sự lựa chọn nào cho và , câu hỏi phải được hiểu là: " Chúng ta nên xem xét số lượng ký hiệu nào trong bảng chữ cái trung gian để phù hợp nhất với cấu trúc và các thuộc tính của toàn bộ Morse mã, "cũng đòi hỏi phải xác định hai mã hóa giữa ba cấp độ.Σ 3 Σ 2Σ1Σ3Σ2

Căn cứ vào thực tế rằng mã Morse là một tiền tố homomorphic (độ dài thay đổi) mã mà ngăn cản bất kỳ sự mơ hồ khi giải mã tín hiệu, chúng ta có thể giải thích đơn giản là tài sản quan trọng này với một ternary bảng chữ cái { , , }, và hai mã hóa chương trình từ đến và từ đến , cả hai dạng đồng hình và tiền tố, do đó, cả hai mã không rõ ràng và do đó có thể được tạo thành một tiền tố rõ ràng mã hóa 58 ký hiệu thành nhị phân.C 3 2 Σ 3 Σ 2 C 2 1 Σ 2 Σ 1Σ2=dotdashsepC32Σ3Σ2C21Σ2Σ1

Do đó mã Morse bao gồm một tiền tố ternary đang thể hiện trong bảng chữ cái , , , với ba biểu tượng tự mã hóa trong hệ nhị phân với các từ mã sau:}{ dotdashsep }

dot 1110 0010 , vàdash 1110sep 00

Lưu ý rằng cái được gọi là khoảng trắng giữa liên tiếp dothoặc dashthực sự được bao gồm trong biểu diễn dotdash, vì đây là biểu diễn toán học thông thường cho các loại mã như vậy, thường được định nghĩa là đồng cấu chuỗi từ ký hiệu nguồn đến từ mã được biểu thị bằng ký hiệu đích, như tôi vừa làm

Điều này khởi hành một chút từ một số bài thuyết trình được đưa ra trong tiêu chuẩn, nhằm mục đích cụ thể hơn là xác định mã trực quan cho người dùng, thay vì phân tích nó cho các thuộc tính cấu trúc của nó. Nhưng mã hóa là như nhau trong cả hai trường hợp.

Ngay cả khi không có thời gian chính xác của tiêu chuẩn, bộ giải mã tín hiệu tương tự vẫn có thể dịch nó sang bảng chữ cái ternary mà chúng tôi đề xuất, do đó cách hiểu trên về mã ternary vẫn còn hiệu lực.

Mã: điểm cơ bản

Câu trả lời này dựa trên Tiêu chuẩn ITU-R M.1677-1 , ngày 10 tháng 10 năm 2009 (nhờ Jason C để tham khảo). Tôi sẽ sử dụng thuật ngữ dotdash, hơn là ditdah, vì đó là thuật ngữ được sử dụng bởi tiêu chuẩn này.

Trước khi chúng ta bắt đầu thảo luận về mã Morse, chúng ta cần phải đồng ý về mã là gì. Các cuộc thảo luận khó khăn về câu hỏi này rõ ràng đòi hỏi nó.

Về cơ bản, thông tin cần phải được trình bày để được truyền hoặc xử lý. Mã là một hệ thống để dịch thông tin từ một hệ thống biểu diễn sang hệ thống khác . Đây là một định nghĩa rất chung chung. Chúng ta phải cẩn thận không nhầm lẫn giữa khái niệm về một đại diện của một đại diện ( nguồn ) sang một đại diện khác ( mục tiêu ).

Một đại diện có thể có nhiều dạng, chẳng hạn như điện áp thay đổi, các chấm màu trên giấy, chuỗi ký tự, chữ số, chuỗi nhị phân 0 và 1, v.v. Điều quan trọng là phải phân biệt giữa biểu diễn tương tự và chính thức (hoặc logic hoặc trừu tượng) .

Một đại diện tương tự / vật lý là một bản vẽ, một mức điện áp khác nhau, một hình dạng (cho một chữ cái).

Một biểu diễn logic / chính thức / trừu tượng là một biểu diễn toán học với các biểu đồ trừu tượng, các chuỗi ký hiệu hoặc các thực thể toán học khác.

Mặc dù một số thông tin ban đầu có thể là tương tự, chúng tôi thường chuyển đổi nó thành biểu diễn logic để có thể xác định chính xác quá trình xử lý của nó bằng phương tiện toán học hoặc theo con người.

Ngược lại, chúng ta xử lý biểu diễn logic bằng các thiết bị vật lý, chẳng hạn như máy tính hoặc máy phát, chúng ta cần đưa ra một dạng tương tự cho biểu diễn logic.

Đối với mục đích của phân tích này, hình thức tương tự duy nhất chúng tôi xem xét là được sử dụng để truyền, như được mô tả trong tiêu chuẩn. Nhưng ngay cả khi đó, chúng tôi sẽ xem xét rằng bước đầu tiên là diễn giải biểu diễn tương tự này như là một triển khai trực tiếp của biểu diễn logic có cấu trúc giống hệt nhau, trên đó chúng tôi xây dựng phân tích về loại mã Morse có thể là mã nào. Lý thuyết mã là một cơ thể toán học của kiến ​​thức dựa trên phân tích các biểu diễn logic.

Tuy nhiên, chúng ta sẽ quay trở lại về quá trình chuyển đổi tương tự / logic trong cuộc thảo luận ở cuối.

Mã: định nghĩa

View logic của chúng tôi là mã được sử dụng để dịch các nguồn chuỗi trên một nguồn bảng chữ cái đến một mục tiêu bảng chữ cái . Thông thường, cả hai bảng chữ cái đều giống hệt nhau, thường là nhị phân, khi mục đích là thêm một số thuộc tính bổ sung vào biểu diễn thông tin, chẳng hạn như làm cho nó có khả năng chống lỗi cao hơn (phát hiện và sửa lỗi) hoặc làm cho biểu diễn nhỏ hơn bằng cách loại bỏ sự dư thừa (nén mã không mất dữ liệu) và có thể với việc mất kiểm soát cẩn thận một số thông tin (nén mất dữ liệu).TST

Tuy nhiên, mục đích của mã Morse là chỉ cung cấp một cách để biểu diễn các chuỗi trên một bảng chữ cái lớn, thành các chuỗi dựa trên một bảng chữ cái nhỏ hơn nhiều (thực sự là nhị phân), sử dụng một bảng chữ cái trung gian gần như nhị phân (dấu chấm và dấu gạch ngang) để thích nghi tốt hơn với con người nhận thức và khả năng thao túng. Điều này đạt được bằng cái được gọi là mã có độ dài thay đổi :

Sử dụng thuật ngữ từ lý thuyết ngôn ngữ chính thức, định nghĩa toán học chính xác như sau: Gọi và là hai tập hợp hữu hạn, được gọi là bảng chữ cái nguồn và đích tương ứng. Mã là một hàm tổng ánh xạ từng ký hiệu từ đến một chuỗi các ký hiệu trên và phần mở rộng của thành một phép đồng hình của thành , ánh xạ tự nhiên từng chuỗi các ký hiệu nguồn cho một chuỗi các ký hiệu đích, được gọi là phần mở rộng của nó.T C : S T * S T C S * T *STC:STSTCST

Chúng tôi gọi từ mã hình ảnh của một biểu tượng . s SC(s)TsS

Mã có độ dài thay đổi có thể giải mã duy nhất nếu tính đồng cấu tương ứng của thành là dạng tiêm . Điều đó có nghĩa là bất kỳ chuỗi nào trong đều có thể là hình ảnh của nhiều nhất một chuỗi trong . Chúng tôi cũng nói rằng mã này không rõ ràng , có nghĩa là bất kỳ chuỗi nào cũng có thể được giải mã rõ ràng, nếu có.S * T * T * S *CSTTS

Mã có độ dài thay đổi là mã tiền tố nếu không có từ mã nào là tiền tố của mã khác. Nó cũng là tất cả mã tức thời , hoặc không ngữ cảnh . Lý do cho những cái tên này là, khi đọc một chuỗi mục tiêu bắt đầu bằng một từ mã của mã tiền tố, bạn nhận ra sự kết thúc của từ mã ngay khi bạn đọc ký hiệu cuối cùng của nó, mà không cần phải biết / đọc ký hiệu tiếp theo. Do đó, mã tiền tố không rõ ràng và rất dễ giải mã nhanh.w

Có thể dễ dàng thấy rằng khả năng giải mã duy nhất và thuộc tính tiền tố được đóng dưới thành phần mã.

Lưu ý rằng định nghĩa như một sự đồng hình hàm ý rằng không có sự tách biệt đặc biệt giữa các từ mã. Đó là cấu trúc của chúng, chẳng hạn như thuộc tính tiền tố, cho phép xác định chúng rõ ràng.

Thật vậy, nếu có các ký hiệu phân tách như vậy, chúng sẽ phải là một phần của bảng chữ cái đích, vì chúng sẽ cần thiết để giải mã chuỗi từ bảng chữ cái đích. Sau đó, sẽ khá đơn giản để trở lại mô hình lý thuyết của mã có độ dài thay đổi bằng cách nối thêm dấu phân cách vào từ mã trước đó. Nếu điều đó làm tăng khó khăn theo ngữ cảnh (ví dụ do nhiều dấu phân cách), đó sẽ chỉ là một gợi ý rằng mã phức tạp hơn rõ ràng. Đây là một lý do tốt để bám vào mô hình lý thuyết được mô tả ở trên.

Mã Morse

Mã Morse được mô tả trong tiêu chuẩn ở ba cấp độ:

  • 3. nó được dự định cung cấp một mã hóa văn bản ngôn ngữ tự nhiên, sử dụng 57 ký tự (27 chữ cái, 10 chữ số, 20 từ đồng nghĩa và ký tự) và một khoảng trắng giữa các từ để cắt chuỗi ký tự thành các từ. Không gian giữa các từ được sử dụng như một ký tự đặc biệt, có thể được trộn lẫn với các từ khác, mà tôi sẽ lưu ý SEP.

  • 2. tất cả các ký tự này sẽ được mã hóa thành các chuỗi liên tiếp dashdot, bằng cách sử dụng khoảng trắng giữa các chữ cái, mà tôi sẽ lưu ý sep, để tách dashdotmột chữ cái khỏi các chữ cái tiếp theo.

  • 1. Các dashdot, cũng như sepphải được mã hóa như tín hiệu hay vắng mặt của tín hiệu (gọi là khoảng cách) với chiều dài được xác định một cách chính xác về một số đơn vị chấp nhận. Cụ thể, dashdot mã hóa một chữ cái phải được phân tách bằng khoảng trắng giữa các phần tử, mà tôi sẽ lưu ý σ.

Điều này đã gọi cho một vài kết luận.

Thông điệp được truyền và nhận ở dạng tương tự là một chuỗi các đơn vị độ dài (chiều dài không gian hoặc độ dài thời gian), sao cho tín hiệu tắt trong toàn bộ thời lượng của mỗi đơn vị như được chỉ định trong Phụ lục 1, Phần I, phần 2 của tiêu chuẩn :

2   Spacing and length of the signals
2.1 A dash is equal to three dots.
2.2 The space between the signals forming the same letter is equal to one dot.
2.3 The space between two letters is equal to three dots.
2.4 The space between two words is equal to seven dots.

Đây rõ ràng là một mã hóa tương tự trong những gì được biết đến như một dòng bit, có thể được thể hiện một cách logic trong ký hiệu nhị phân của một chuỗi các 0ans 1, đứng cho analog tắttrên .

Để trừu tượng hóa các vấn đề liên quan đến biểu diễn tương tự, do đó chúng ta có thể xem xét rằng các thông điệp mã Morse được truyền dưới dạng chuỗi bit, mà chúng ta sẽ lưu ý với 01.

Do đó đoạn trích trên từ tiêu chuẩn có thể được thể hiện một cách logic như sau:

  • 0. A dotđược đại diện bởi 1.
  • 1. A dashđược đại diện bởi 111.
  • 2. Một không gian liên yếu tố σđược đại diện bởi 0.
  • 3. Một không gian liên chữ sepđược đại diện bởi 000.
  • 4 . Một không gian giữa các từ SEPđược đại diện bởi 0000000.

Vì vậy, chúng ta có thể thấy mã Morse khi sử dụng 5 từ mã trong nhị phân để mã hóa 5 ký hiệu này. Ngoại trừ thực tế rằng đây không hoàn toàn là cách mô tả hệ thống, còn có một số điều nữa, và nó không phải là cách thuận tiện nhất mà nó có thể nghĩ ra, từ quan điểm ngây thơ hoặc toán học.

Cũng lưu ý rằng mô tả này dành cho giáo dân, không phải chuyên gia lý thuyết mã. Vì lý do đó, nó mô tả nhiều hơn sự xuất hiện rõ ràng hơn cấu trúc bên trong mà biện minh cho nó. Không có lý do gì để loại trừ các mô tả khác tương thích với mô tả này, mặc dù có cấu trúc toán học hơn, để nhấn mạnh các thuộc tính của mã.

Nhưng trước tiên, chúng ta nên lưu ý rằng mô tả đầy đủ của mã bao gồm 3 cấp độ đại diện, có thể nhận ra ngay lập tức:

  • 3. Các văn bản, bao gồm một chuỗi các ký tự, bao gồm SEP.
  • 2. Các mã hóa của một chuỗi thư như là một chuỗi của dot, dashsep.
  • 1. Mã hóa của chuỗi cấp 2 của ba chuỗi này symbolsdưới dạng chuỗi nhị phân.

Chúng ta có thể thảo luận về các ký hiệu được mã hóa trong cái gì, nhưng một khía cạnh thiết yếu của mã Morse là nó có ba cấp độ đại diện này, với các ký tự ở trên cùng, dots và dashes ở giữa và bit 01ở dưới cùng .

Điều này ngụ ý rằng nhất thiết phải có hai mã, một từ cấp 3 đến cấp 2 và mã còn lại từ cấp 2 đến cấp 1.

Phân tích ba cấp độ đại diện

Để có một phân tích nhất quán về hệ thống mã hóa 3 tầng này, trước tiên chúng ta nên phân tích loại thông tin nào có liên quan ở mỗi cấp độ.

  • 1. Chuỗi bit, theo định nghĩa và theo sự cần thiết của biểu diễn tương tự của nó, chỉ bao gồm 01.

  • 3. Ở cấp độ văn bản, chúng ta cần và bảng chữ cái của 58 ký hiệu, bao gồm 57 ký tự và khoảng trắng giữa các từ SEP. Tất cả 58 trong số chúng cuối cùng phải có mã hóa nhị phân. Nhưng, mặc dù tiêu chuẩn mã Morse chỉ định các ký tự 57 + 1 này, nhưng nó không chỉ định cách sử dụng chúng để mã hóa thông tin. Đó là vai trò của tiếng Anh và các ngôn ngữ tự nhiên khác. Mã Morse cung cấp cho hệ thống khác một bảng chữ cái gồm 58 ký hiệu, trên đó họ có thể xây dựng một số mã 58-ary, nhưng mã Morse không phải là mã 58-ary.

  • 2. Ở cấp độ dotdashcấp độ, tất cả những gì chúng ta cần là hai ký hiệu này để mã hóa 57 ký tự, tức là cung cấp một từ mã cho mỗi chuỗi dưới dạng dotdashcùng với một dấu phân cách sepđể đánh dấu khi một chữ cái kết thúc và một ký tự khác bắt đầu. Chúng ta cũng cần một số phương tiện mã hóa không gian giữa các từ SEP. Chúng tôi có thể cố gắng cung cấp cho nó trực tiếp tại tờ 1, nhưng điều này sẽ làm xáo trộn tổ chức mã có cấu trúc bậc khác.

Thật vậy, mô tả của tiêu chuẩn có thể bị chỉ trích một cách đúng đắn khi làm điều đó. Nhưng các tác giả có thể đã nghĩ rằng bài thuyết trình của họ sẽ đơn giản hơn để nắm bắt cho người dùng trung bình. Ngoài ra, nó tuân theo một mô tả truyền thống về mã Morse, có trước loại phân tích toán học này.

Điều này kêu gọi một số nhận xét:

  • ở cấp độ 3, cấp độ chữ cái, không gian liên chữ sepkhông còn ý nghĩa. Điều này là khá bình thường, vì nó không có ý nghĩa gì trong vũ trụ của các chữ cái hơn là không gian ngăn cách hai ký tự viết trên giấy. Ở cấp độ 2 là cần thiết để nhận ra các từ mã đại diện cho các chữ cái, nhưng đó là tất cả.

  • tương tự ở cấp 2, không gian liên yếu tố σkhông còn ý nghĩa. Nó không có ý nghĩa gì trong thế giới của dotdash, nhưng chỉ cần thiết ở cấp 1 để xác định các từ mã nhị phân đại diện dot, dash. Nhưng ở cấp 1, nó không thể phân biệt được với bit 0.

Vì vậy, không gian liên yếu tố σkhông còn gì đặc biệt. Nó chỉ là một công dụng của 0.

Σ2Σ1

dot10dash1110

Σ2sep0000dotdash00sep0dotdash0

Σ2=dotdashsepC21:Σ2Σ1

  • dot10

  • dash1110

  • sep00

Và chúng tôi có một bất ngờ tốt khi phát hiện ra rằng không có từ mã nào là tiền tố của người khác. Do đó, chúng tôi có một mã tiền tố, không rõ ràng và dễ giải mã.

C32:Σ3Σ2

dotdashΣ3dot dot dash dotf

f dot dot dash dot sep

Σ3SEP00000000sep0dotdashSEP0000

SEPΣ2sep00SEPsep sep

Do đó chúng ta có thể mã hóa bảng chữ cái Σ3={A,B,,Z,0,1,,9,?,=,,×,@, SEP}C32:Σ3Σ2

  • A dot dash se

  • B dash dodot dot sep

  • Z dash dash dot dot sep

  • 7 dash dash dot dot dot sep
  • SEP sep sep

C32

CMorse=C21C32

Do đó chúng ta có thể kết luận rằng mã Morse có thể được hiểu, và dễ dàng phân tích, như là thành phần của một tiền tố nhị phân mã hóa của một 3 ký tự bảng chữ cái { dot, dash, sep} thành một bảng chữ cái nhị phân, và mã hóa một tiền tố của một bảng chữ cái 58 biểu tượng (57 ký tự và một khoảng trắng) vào bảng chữ cái 3 chữ cái.

Thành phần chính nó là một tiền mã hóa của 58 ký hiệu thành một biểu diễn nhị phân.

Nhận xét về phân tích này.

Luôn luôn khó khăn để thiết lập rằng một bản trình bày về cấu trúc là thứ tốt nhất có thể đưa ra. Tuy nhiên, dường như phân tích trên đáp ứng các tiêu chí được thiết lập ở đầu câu trả lời này: sự gần gũi với định nghĩa 3 tầng, được trình bày chính thức theo lý thuyết mã hóa hiện tại, tính đơn giản và chứng minh các thuộc tính chính của mã.

Lưu ý rằng có rất ít điểm trong việc tìm kiếm các thuộc tính sửa lỗi. Mã Morse thậm chí có thể không phát hiện ra một lỗi bit nào vì nó có thể đơn giản thay đổi hai dotthành một dash. Tuy nhiên, nó chỉ gây ra lỗi cục bộ.

Về nén, mã hóa ternary được thiết kế để giảm khoảng số lượng dấu chấm và dấu gạch ngang, trong một loại mã hóa Huffman gần đúng . Nhưng hai mã tổng hợp có thể dễ dàng được làm dày đặc hơn.

Về kích thước của bảng chữ cái, không có lựa chọn nào cho bảng chữ cái nhị phân và 58 ký hiệu. Bảng chữ cái trung gian có thể chứa nhiều biểu tượng hơn, nhưng mục đích sẽ là gì?

Tuy nhiên, một số người sẽ có xu hướng nhận ra không gian DETở cấp độ 2, do đó làm cho bảng chữ cái bậc bốn , sau đó sử dụng nó trực tiếp ở cấp độ 3, được mã hóa như chính nó ở cấp độ 2.

DET0000C21CMorse

Thật vậy, một lựa chọn như vậy sẽ làm cho chuỗi nhị phân 0000mơ hồ, có thể giải mã được hoặc là SEPhoặc sep sep. Sự mơ hồ sẽ phải được giải quyết bằng một quy tắc theo ngữ cảnh sepkhông thể tự tuân theo, làm cho việc chính thức hóa trở nên phức tạp hơn.

Tầm quan trọng của quá trình chuyển đổi tương tự sang logic.

Phân tích này phụ thuộc rất nhiều vào thực tế là sự phân tách tín hiệu bật / tắt thành các đơn vị có độ dài bằng nhau cho thấy rõ ràng một biểu diễn tương tự của chuỗi nhị phân. Hơn nữa, độ dài tính theo đơn vị hoàn toàn chính xác cho phân tích trên, điều này dường như không thể xảy ra do tình cờ (mặc dù điều đó là có thể).

Tuy nhiên, từ một cái nhìn (quá khó hiểu) về bằng sáng chế gốc 1647 , dường như nó không chính xác lắm, với các câu như (trên đầu trang 2):

Dấu của một chữ số riêng biệt hoặc một chữ số ghép khi được sử dụng trong câu của từ hoặc chữ số, bao gồm khoảng cách hoặc khoảng cách giữa các ký tự có phạm vi lớn hơn khoảng cách được sử dụng để phân tách các ký tự tạo thành bất kỳ khác biệt nào như vậy hoặc số ghép.

Những người sau đó được gửi bằng tay hoặc nhận bằng tai cũng không chắc là chính xác. Thật vậy, nắm tay của họ , tức là thời gian của họ, thường được nhận ra. Quan điểm này cũng được hỗ trợ bởi thực tế là độ dài khoảng cách không phải lúc nào cũng được tôn trọng , đặc biệt là khi học mã Morse.

Các tình huống này tương ứng với chế độ xem tương tự của mã là tín hiệu ngắn (dấu chấm), tín hiệu trung bình (dấu gạch ngang) và tạm dừng ngắn, trung bình và dài. Chuyển vị trực tiếp vào một bảng chữ cái logic sẽ tự nhiên cung cấp cho một số năm bảng chữ cái, vào đó 58 ký tự phải được mã hóa. Tất nhiên đây không còn là bản trình bày 3 tầng của mã Morse.

Tuy nhiên, để có ý nghĩa (và có thể tránh sự mơ hồ), bảng chữ cái này nên được sử dụng với ràng buộc là hai ký hiệu tín hiệu ( dothoặc dash) không thể theo nhau và các ký hiệu tạm dừng cũng không thể đi theo nhau. Phân tích mã và các thuộc tính của nó sẽ trở nên phức tạp hơn và cách tự nhiên để đơn giản hóa nó là thực hiện những gì đã làm: giới thiệu thời gian thích hợp để biến nó thành thành phần của hai mã, dẫn đến phân tích khá đơn giản được đưa ra ở trên ( hãy nhớ rằng nó bao gồm hiển thị mã là tiền tố).

Hơn nữa, không nhất thiết phải tuân theo thời gian chính xác trong biểu diễn tương tự. Vì bộ giải mã của bản dịch tương tự có thể phân biệt các khoảng dừng ngắn, trung bình và dài, bằng bất kỳ phương tiện nào, nó chỉ nên bắt chước những gì đã được thực hiện trong trường hợp nhị phân. Do đó tín hiệu ngắn và trung bình (nhất thiết phải theo sau là tạm dừng) được nhận dạng là logic dothoặc dash. Tạm dừng ngắn bị lãng quên, vì chỉ phục vụ để đánh dấu sự kết thúc của dothoặc dash. Tạm dừng trung bình được công nhận là sepvà tạm dừng dài được công nhận là hai seplần liên tiếp. Do đó, tín hiệu tương tự được biểu diễn trong bảng chữ cái ternary, có thể được sử dụng như trước để mã hóa bảng chữ cái 58 ký hiệu. Phân tích ban đầu của chúng tôi có thể được sử dụng ngay cả khi thời gian không được tôn trọng nghiêm ngặt.

Ngoài ra, có thể sử dụng xen kẽ tạm dừng tín hiệu để biến bảng chữ cái này thành một bảng tạm thời, chỉ giữ ba thời lượng làm biểu tượng của bảng chữ cái và sử dụng phân tích theo ngữ cảnh để xác định xem thời lượng nhất định là tín hiệu hay tạm dừng. Nhưng điều này một lần nữa là một chút phức tạp để phân tích.

Điều này chỉ cho thấy rằng có nhiều cách để xem xét mọi thứ, nhưng chúng không nhất thiết phải thuận tiện và có thể không dễ dàng cho vay để phân tích với các công cụ toán học đã được phát triển để phân tích mã.

Tham khảo thêm về các bằng sáng chế có thể được tìm thấy trên Internet.

Phần kết luận

Với các thời gian chính xác của tiêu chuẩn, một câu trả lời tốt dường như coi mã Morse là thành phần của mã hóa tiền tố ternary (gồm 58 ký tự) thành một bảng chữ cái 3 ký hiệu, bao gồm mã hóa tiền tố nhị phân của ba ký hiệu này.

Không có thời gian chính xác của tiêu chuẩn, mức nhị phân không còn có thể được xem xét. Sau đó, việc giải mã tương tự sang logic tự nhiên diễn ra ở cấp độ của bảng chữ cái trung gian của dotdash. Tuy nhiên, bộ giải mã tương tự logic có thể giải mã được bảng chữ cái 3 ký hiệu trước đó, do đó duy trì khả năng ứng dụng trong phân tích của chúng tôi.


1
Vui lòng chuyển bất kỳ cuộc trò chuyện nào nữa sang chat.stackexchange.com/rooms/21638/ từ
Logic lang thang

1
Bình luận không dành cho thảo luận mở rộng; cuộc trò chuyện này đã được chuyển sang trò chuyện .
Raphael

Câu hỏi: Trong đối số ternary bạn bắt đầu bằng một bảng chữ cái {0,1}, từ đây bạn xây dựng bốn ký hiệu {dot = 10, dash = 1110, sep1 = 00, sep2 = 000000}, từ đây bạn xây dựng một bộ từ mã theo thứ tự bằng cách cho phép sep2 = sep1 sep1 sep1 . Bộ từ mã được chọn vì nó liên kết ngầm các ký hiệu với mã hóa, thuận tiện và OP đang hỏi về lưu trữ nhị phân. Tuy nhiên, tại sao bạn không thể sử dụng bộ từ mã {rest = 0, on = 1} rồi nói "dot = on", "dash = on on on", sep0 = "off", sep1 = "off off" , sep2 = "tắt tắt tắt tắt" (trong đó sep0 là phần còn lại giao nhau)?
Jason C

^ Trong trường hợp đó, đối số dành cho một từ mã nhị phân được đặt trên một từ ba, nhưng sử dụng một đối số tương tự và mạnh tương đương như một đối số thứ ba được đưa ra ở đây. Đó là, lựa chọn mang lại ý nghĩa đặc biệt cho nhiều dấu phân cách liên tiếp nhưng không mang lại ý nghĩa đặc biệt cho nhiều thứ khác - một thứ khác là cơ bản cho lập luận ternary, nhưng cũng có vẻ tùy tiện.
Jason C


28

Câu trả lời này không dài như vẻ ngoài của nó; Trang web này chỉ đặt rất nhiều khoảng cách giữa các mục danh sách! Cập nhật: Trên thực tế, nó đang trở nên khá dài ...

Mã Morse không "chính thức" nhị phân, ternary, quernary, quinary, hoặc thậm chí 57-ary (nếu tôi đếm chính xác). Tranh cãi về cái mà nó không có ngữ cảnh là không hiệu quả. Tùy thuộc vào bạn để xác định cái nào trong số năm cái đó dựa trên ứng dụng của bạn và các yêu cầu mã hóa cho tình huống cụ thể của bạn . Cuối cùng, có những ưu và nhược điểm đối với từng kích thước tập hợp biểu tượng, bạn nên cân nhắc cho tình huống của mình trước khi đưa ra quyết định.

Về cơ sở, M.1677 , tiêu chuẩn Mã Morse quốc tế, phần 2, định nghĩa thời gian là:

2 Khoảng cách và độ dài của tín hiệu
2.1 Dấu gạch ngang bằng ba dấu chấm.
2.2 Khoảng cách giữa các tín hiệu tạo thành cùng một chữ cái bằng một dấu chấm.
2.3 Khoảng cách giữa hai chữ cái bằng ba dấu chấm.
2.4 Khoảng cách giữa hai từ bằng bảy dấu chấm.

Lưu ý rằng chỉ xác định thời gian, ví dụ: dấu gạch ngang không có nghĩa giống như ba dấu chấm, nó chỉ đơn giản là cùng độ dài. Đơn vị cơ sở của thời gian là một dấu chấm.


Nhị phân

Chúng tôi có thể chọn nhị phân nếu muốn. Có thể biểu diễn Mã Morse bằng "nhị phân nghiêm ngặt", như bạn gọi nó - cách tiếp cận của tác giả đó là gán các chữ số cho "dấu chấm" và "dấu gạch ngang". Cách tiếp cận đó không hiệu quả và tôi không nghĩ rằng tác giả đã nắm chắc mã Morse. Nhưng có một cách tiếp cận khác nhau có hiệu quả. Nếu chúng ta chọn nhị phân, về cơ bản chúng ta đại diện cho dù tín hiệu cao hay thấp với mỗi biểu tượng chiếm một lát cắt thời gian dài một chấm. Lưu ý rằng đây cũng là cách tiếp cận được mô tả trên trang Danh sách mã nhị phân mà bạn đã trích dẫn.

Các mã hóa nhị phân khác cũng có thể được chọn (ví dụ: câu trả lời của Bob Jarvis ) với chi phí tăng độ khó giải mã trở lại Mã Morse có thể nghe được (ví dụ, mã hóa của Bob không thể được giải mã một cách vô nghĩa, ví dụ, sự đánh đổi là nó cung cấp các chuỗi được mã hóa ngắn hơn).

Biểu tượng:

  • Thấp, tắt, v.v. (0)
  • Cao, trên, vv (1)

Ví dụ mã hóa:

  • Dấu tách tín hiệu: 0
  • Dấu phân cách: 000
  • Dấu tách từ: 0000000
  • Ba dấu chấm: 10101
  • Ba dấu gạch ngang: 11101110111
  • Từ "con trai": 101010001110111011100011101
  • Cụm từ "là một": 10100010101000000010111

Ưu điểm:

  • Kích thước bộ biểu tượng tối thiểu
  • Dễ dàng quản lý với logic kỹ thuật số điển hình
  • Dễ dàng giải mã thành Mã Morse có thể nghe được (giả sử không có xác nhận nào được thực hiện); giải mã không trạng thái và không yêu cầu lưu trữ thông tin về thời gian của các ký hiệu (mọi ký hiệu đều có cùng độ dài).

Nhược điểm:

  • Mã hóa dài.
  • Nhiều cơ hội cho mã hóa không hợp lệ.
  • Ý nghĩa biểu tượng cá nhân (0, 1) phụ thuộc vào ngữ cảnh.


Chim nhạn

Với lựa chọn này, chúng tôi xác định khoảng cách chữ và từ là phần còn lại và khoảng cách tín hiệu là ẩn (mặc dù bạn có thể chọn yêu cầu ký hiệu phần còn lại chiều dài dấu chấm giữa các tín hiệu, nếu nó phù hợp với bạn hơn).

Biểu tượng:

  • Phần còn lại của chiều dài chấm (0)
  • Chấm (1)
  • Dấu gạch ngang (2)

Ví dụ mã hóa:

  • Dấu phân cách: 000
  • Dấu tách từ: 0000000
  • Ba dấu chấm: 111
  • Ba dấu gạch ngang: 222
  • Từ "con trai": 11100022200021
  • Cụm từ "là một": 11000111000000012

Ưu điểm:

  • Kích thước bộ biểu tượng nhỏ.
  • Bộ tách tín hiệu không còn cần thiết.
  • Độ dài mã hóa ngắn hơn nhị phân.
  • Loại bỏ một số mã hóa không hợp lệ (ví dụ 0110 với lựa chọn nhị phân không còn có thể).

Nhược điểm:

  • Vẫn mã hóa dài.
  • Vẫn còn nhiều khả năng cho mã hóa không hợp lệ, đặc biệt là phần còn lại.
  • Không thể được giải mã statelessly trừ khi bạn chọn để đặt đang gánh dot chiều dài rõ ràng giữa các tín hiệu.
  • Dấu phân cách tín hiệu được ẩn trừ khi bạn chọn đặt độ dài chấm rõ ràng nằm giữa các tín hiệu.
  • Một số ý nghĩa biểu tượng cá nhân (0) phụ thuộc vào ngữ cảnh.


Đệ tứ

Biểu tượng:

  • Chữ tách (0)
  • Dấu phân cách (1)
  • Chấm (2)
  • Dấu gạch ngang (3)

Ví dụ mã hóa:

  • Ba dấu chấm: 222
  • Ba dấu gạch ngang: 333
  • Từ "con trai": 2220333032
  • Cụm từ "là một": 220222123

Ưu điểm:

  • Chiều dài mã hóa rất ngắn.
  • Khả năng mã hóa không hợp lệ bị giảm.
  • Các biểu tượng là chính xác về ngữ nghĩa.
  • Có thể cho rằng, con người dễ đọc hơn.

Nhược điểm:

  • Kích thước bộ biểu tượng lớn.
  • Không thể được giải mã phi trạng thái.
  • Dấu tách tín hiệu là ẩn.


Danh mục

Một cách giải thích trực tiếp danh sách của Wikipedia. Lưu ý rằng điều này rất giống với lựa chọn nhị phân ngoại trừ sự kết hợp hợp lệ khác nhau của nhị phân 0 hoặc 1 được đưa ra các ký hiệu riêng.

Biểu tượng:

  • Dấu tách tín hiệu (0)
  • Chữ tách (1)
  • Dấu tách từ (2)
  • Chấm (3)
  • Dấu gạch ngang (4)

Ví dụ mã hóa:

  • Ba chấm: 30303
  • Ba dấu gạch ngang: 40404
  • Từ "con trai": 303031404041403
  • Cụm từ "là một": 3031303032304

Ưu điểm (so với bậc bốn):

  • Có thể được giải mã phi trạng thái.
  • Kích thước tập hợp biểu tượng duy nhất rõ ràng, trực tiếp và chính xác đại diện cho năm đối tượng được đề cập trong phần 2 của tiêu chuẩn: "dấu chấm" (mà tất cả các thời gian đều liên quan đến), "dấu gạch ngang", "khoảng cách giữa các tín hiệu", "khoảng cách giữa hai chữ cái "," khoảng cách giữa hai từ ".

Nhược điểm (so với bậc bốn):

  • Khả năng cao hơn cho mã hóa không hợp lệ.
  • Tăng độ dài mã hóa mà không cần thêm thông tin (đánh đổi là giải mã dễ dàng).
  • Không như dễ dàng để giải mã là sự lựa chọn nhị phân, trong đó mỗi biểu tượng là một độ dài khác nhau trong thời gian và sự liên kết này phải được duy trì ở đâu đó.


57-ary:

Bao gồm cho đầy đủ.

Biểu tượng:

  • 26 chữ cái
  • 10 số
  • 20 dấu chấm câu và dấu hiệu linh tinh
  • Dấu tách từ (dấu cách)

Ví dụ mã hóa:

  • Từ "con trai": son
  • Cụm từ "là một": is a

Ưu điểm:

  • Mã hóa ngắn nhất
  • Con người có thể đọc được
  • Mã hóa không hợp lệ là không thể.

Nhược điểm:

  • Bộ biểu tượng lớn nhất
  • Khó giải mã thành Mã Morse; cần thiết để duy trì các bảng trình tự đầu ra Mã Morse cho mỗi ký hiệu và cần thiết để phát hiện ranh giới từ và các chữ cái liền kề để xác định vị trí chèn các phần còn lại khác nhau.
  • Không thể mở rộng ra ngoài đặc điểm kỹ thuật của Mã Morse mà không cần thêm các ký hiệu mới (đánh đổi để được miễn nhiễm với các bảng mã không hợp lệ).
  • Dấu tách tín hiệu và chữ cái là ẩn.

Chấm dứt

Để lưu trữ dưới dạng luồng biểu tượng trên thiết bị, nếu bạn cần làm điều đó, cần lưu ý rằng M.1677 xác định các chuỗi kết thúc tin nhắn và truyền. Từ phần II:

5 Mỗi telegram sẽ được kết thúc bằng tín hiệu chéo (. -. -.)
6 Kết thúc truyền sẽ được biểu thị bằng tín hiệu chéo (. -. -.) Theo sau lời mời truyền tín hiệu K (-. -)
7 Kết thúc công việc sẽ được chỉ định bởi trạm truyền tín hiệu điện tín cuối cùng. Dấu hiệu chính xác là kết thúc tín hiệu công việc (.. -. -)

Thật không may, tiêu chuẩn im lặng về khả năng phân biệt, ví dụ chuỗi "+ K" với chuỗi ( kết thúc telegram , thư mời truyền ). Tuy nhiên, kết thúc công việc là duy nhất. Nếu bạn đang lưu trữ mã morse, thì bạn sẽ phải đưa ra lựa chọn về cách bạn muốn chỉ ra kết thúc của chuỗi được lưu trữ.

Ví dụ: nếu bạn đang lưu trữ toàn bộ cuộc hội thoại và đang sử dụng bộ ký hiệu nhị phân, bạn có thể coi hợp lý kết thúc công việc là kết thúc của chỉ báo chuỗi, được biểu thị dưới dạng chuỗi bit duy nhất 101010111010111. Bạn cần xem xét loại dữ liệu bạn đang lưu trữ (ví dụ: các đoạn tin nhắn, toàn bộ tin nhắn, toàn bộ cuộc hội thoại) cũng như các phương tiện được cung cấp cho bạn bởi phương tiện lưu trữ của bạn (ví dụ: khả năng tiền tố với độ dài tin nhắn) trước khi quyết định. Tôi cho rằng bạn có thể đi xa hơn để xác định chỉ báo kết thúc chuỗi của riêng bạn. Trong mọi trường hợp, đây là tất cả các vấn đề về lưu trữ cơ bản và có quá nhiều khả năng để liệt kê ở đây. Sự lựa chọn thực sự tùy thuộc vào bạn dựa trên bất cứ điều gì phù hợp với tình huống của bạn.


Không thể được giải mã statelessly: Những mã hóa yêu cầu một số nhà nước phải được duy trì để giải mã vào âm thanh Mã Morse. Tất cả đều yêu cầu "Nếu biểu tượng trước là dấu chấm / dấu gạch ngang và biểu tượng hiện tại là dấu chấm / dấu gạch thì hãy chèn dấu tách tín hiệu". Mặc dù bạn có thể thử và "gian lận" và tự động nối thêm một dấu tách tín hiệu cho tất cả các ký hiệu trong khi giảm dấu tách từ thành 5 phần còn lại và dấu tách chữ cái thành 1, M.1677 afaict không rõ ràng cấm các dấu tách từ liên tiếp, phá vỡ khoảng cách này.

Dấu tách tín hiệu là ẩn: Điều này liên quan trực tiếp đến ghi chú trên nhưng định hướng ngữ nghĩa hơn. Các bảng mã này có các dấu tách tín hiệu ngầm trong ký hiệu của chúng. Đó là "zzz" theo trực giác ba chữ z riêng biệt, các ranh giới được "cõng" trên bất cứ thứ gì phân tách các ký hiệu trong chính mã hóa. Hãy xem xét mô tả "ba dấu chấm liên tiếp"; Theo trực giác, chúng tôi có nghĩa là ba riêng biệtdấu chấm, nhưng nếu dấu phân cách không ngụ ý thì điều này có thể được coi là không thể phân biệt được với dấu gạch ngang. Chỉ các biểu diễn nhị phân và nhị phân theo kiểu Wikipedia (hoặc ternary với tùy chọn phân tách tín hiệu rõ ràng) loại bỏ tất cả sự mơ hồ và "phím tắt" ở đây, có thể có giá trị lớn tùy thuộc vào tình huống. Đó là vì lý do này mà có một lập luận mạnh mẽ cho sự lựa chọn kỳ quặc.


TL; DR:

Như bạn có thể thấy, có những ưu điểm và nhược điểm đối với từng loại, và tùy thuộc vào bạn quyết định cách bạn muốn đối xử với nó dựa trên yêu cầu của bạn . Không có câu trả lời đúng. Bạn có thể cố gắng tranh luận rằng cái này phù hợp hơn cái kia nói chung, nhưng những lập luận này sẽ sôi sục theo sở thích phạm vi, vì không có ngữ cảnh, không có câu trả lời đúng.

Bây giờ, tất cả những gì đã nói, theo ý kiến ​​riêng của tôi, sự lựa chọn kỳ quặc là đại diện cảm thấy "đúng" nhất đối với tôi đối với chính Mã Morse (ban đầu tôi đã ủng hộ tứ phương). Đây là lựa chọn duy nhất cung cấp tất cả những điều sau đây:

  • Các biểu tượng không có ngữ cảnh (một biểu tượng tự nó chứa tất cả thông tin về ý nghĩa của nó mà không kiểm tra các biểu tượng liền kề).
  • Đại diện của tất cả các nguyên thủy được xác định trong M.1667.
  • Dấu phân cách (tín hiệu, chữ cái, từ) không được ngụ ý bởi ký hiệu hoặc mã hóa cơ bản (điều này rất quan trọng, nếu tôi viết { dot, dot, dash }, những thứ đó ,rất quan trọng và dễ bị bỏ qua).

Tuy nhiên, có những lập luận mạnh mẽ cho tất cả. Các đối số liên quan đến mã hóa cũng được áp dụng để đối xử với chính Morse. Không có câu trả lời cụ thể 100%, nhưng nó chắc chắn có thể tạo ra một chủ đề tốt để tranh luận với bạn bè của bạn tại quán bar.

. . . -. -


1
Vui lòng chuyển bất kỳ cuộc trò chuyện nào nữa sang chat.stackexchange.com/rooms/21638/ từ
Logic lang thang

1
Bình luận không dành cho thảo luận mở rộng; cuộc trò chuyện này đã được chuyển sang trò chuyện .
Raphael

Bạn tiếp tục đề cập đến giải mã không trạng thái trong các đối số của bạn. Trong lý thuyết mã hóa, các trạng thái dường như chỉ được sử dụng hiếm khi, trong các mã chập, là một họ các mã sửa lỗi. Điều này là hoàn toàn lạc đề vì mã Morse là bất cứ điều gì ngoại trừ sửa lỗi. Thật vậy, nó thậm chí không thể phát hiện ra một số lỗi một bit, chứ chưa nói đến việc sửa chúng. Bạn có nhiều loại mã tùy ý là một phiên bản của mã Morse, nhưng chúng không mang lại sự hiểu biết. Tại sao trình bày chúng? Không yêu cầu các trạng thái, tức là mã hóa đồng cấu, dường như là một yêu cầu tối thiểu. Và bạn bỏ lỡ các bảng mã thú vị. cc @KorayTugay
babou

@babou Không giải mã được đối số?
Koray Tugay

@babou Tôi không ngại có một vài điểm ngoài chủ đề. Tất nhiên các bộ biểu tượng là tùy ý; đó chính xác là điểm tôi đang thực hiện với câu trả lời này. Từ ternary được đặt trên đầu của đối số mã tiền tố nhị phân là tùy ý như nhau. Thoạt nhìn không, nhưng về cơ bản, bạn đã lựa chọn tùy ý để dựa vào đối số trên một từ mã được đặt với một bảng chữ cái hai chữ cái (0 và 1). Đó là một lựa chọn tùy ý, bởi vì lựa chọn cho "sep sep sep" có ý nghĩa đặc biệt nhưng không làm điều đó với "đơn vị 1" là tùy ý. Bạn có thể dễ dàng nói rằng "dấu gạch ngang" là "dấu chấm chấm" và tranh luận về nhị phân trên ternary.
Jason C

5

Bất chấp những suy nghĩ ban đầu của tôi về điều này, hóa ra câu hỏi này có thể được chính thức hóa theo cách thừa nhận một câu trả lời khá chính xác (modulo một vài vấn đề định nghĩa). Câu trả lời hóa ra là 3 hoặc 4, tức là ternary hoặc quernary. Câu trả lời "mọi thứ diễn ra từ 2 đến 57" của đám đông chỉ đúng theo nghĩa là nếu ai đó hỏi bạn về đặc tính của các nhóm abelian, bạn nói với anh ta rằng họ là những người đặt ra.

Hãy bắt đầu bằng cách xem mã hóa vật lý cho mã Morse. Đó thực sự là B ASK , tức là khóa dịch chuyển biên độ nhị phân, chỉ là một cách phức tạp để nói rằng có hai mức biên độ vật lý (điện / quang, v.v.) để chúng ta mã hóa thông điệp của mình. Vì vậy, câu hỏi ngay lập tức là: không phải điều này có nghĩa là câu trả lời là mã Morse là nhị phân? Chà, nó chỉ là nhị phân theo một cách khá không thông tin, theo nghĩa là tín hiệu bật / tắt nhị phân được gửi qua dây không tương ứng trực tiếp với một trong hai dòng hoặc dấu chấm. Ở mức độ tương ứng mơ hồ này, chúng tôi thậm chí có thể gửi mã ASCII (với mã hóa bit trực tiếp, rõ ràng) và gọi nó là "Morse" và / hoặc "nhị phân"; điều tương tự sẽ áp dụng cho bất kỳ mã Huffman nào (thay vì ASCII).

Mc:MTTTT{0,1}c

TTTTTcó một thuật ngữ khác nhau trong đó bất kỳ ánh xạ nào là mã, nhưng những thuật ngữ có thể giải mã duy nhất chỉ được nói như vậy và viết tắt mã UD. Ở đây tôi sẽ chỉ là thuật ngữ sau. Bạn cũng sẽ thấy một lát sau tại sao tôi nói "lý tưởng".)

cTTT

TT

just-dotjust-lineunit-spaceletter-spaceword-spaceunit-spacejust-dotjust-line0just-dotjust-line

  • dit= just-dot unit-space= 10 và
  • dah= just-line unit-space= 1110.

Vì vậy, đó là mã Morse bậc bốn: dit, dah, letter-space, word-space. Quan sát tiếp theo là word-spacecó thể xấp xỉ (hoặc thậm chí được giả định là) hai letter-spaces, tức là sáu số không. Vì vậy, làm thế nào mà bạn có được bộ từ mã ternary; Như tài liệu tham khảo cho dòng lý luận này, xem ví dụ [1] [2] .

T={10,1110,000}{10,1110,000,07}010=0307=0703vì vậy có một yếu tố không độc đáo. Mặc dù về mặt lý thuyết đây là một vấn đề, nó không phải là vấn đề thực tế bởi vì "máy đếm nhịp" của con người dù sao cũng khó đo được khoảng im lặng rất dài, vì vậy về cơ bản, bất kỳ khoảng im lặng nào dài hơn một độ dài nhất định đều được giả định (bởi con người) là một word-spaceloại.

00000T1420T0

ditdahletter-spaceletter-spacejust-linejust-dotunit-space0ditdah000

Bạn cũng có thể sử dụng phương pháp tính toán trit entropy giả định một dahditletter-spacelà "tương đương" như trits [3] , theo nghĩa là-ví dụ-'e' mất 2 trits và 'y' mất 5 trits. Cách tiếp cận trit trừu tượng không hữu ích lắm nếu bạn quan tâm đến việc mỗi biểu tượng thực sự đắt như thế nào trong mã hóa BASK Morse thực trên một dòng. Đối với phần sau, bạn cần đi xuống độ dài bit thực của các ký hiệu 3 (hoặc 4), được xem như là các chuyển tiếp trong một máy tự động. Chẳng hạn, chữ 'e' mất 5 bit để mã hóa (as dit letter-space) trong khi 'y' mất 17 bit (ba dahs, một ditvà a letter-space). Dòng suy nghĩ này quay trở lại với Shannon (xem trang 3-4). Thêm chi tiết có thể được tìm thấytrong "Lý thuyết và mã hóa thông tin" của Blahut , ví dụ, ông tính toán "trung bình 9.296 đơn vị thời gian báo hiệu cho mỗi chữ cái đầu ra nguồn" cho mã Morse bằng cách sử dụng xác suất (vô điều kiện) của các lần xuất hiện bằng tiếng Anh. Đối với một giải trình hơi khác (bởi một nhà động vật học!) Bạn có thể nhìn vào JP Hailman's ; anh ta nhận được mức trung bình khác nhau (10.2) vì anh ta giả sử xác suất hơi khác nhau đối với các chữ cái tiếng Anh, nhưng nếu không thì phân tích của anh ta về mặt khái niệm là như nhau.

Để tóm tắt điều này: bạn có thể lấy một số quan điểm về mã Morse, nhưng một số quan điểm hiệu quả hơn những cái khác khi nói bất cứ điều gì thú vị về nó. Tôi không biết về bất kỳ phân tích nào khi sử dụng chế độ xem "quinary" và để mô hình này không thể rút gọn thành bốn biểu tượng mà bạn phải đưa ra một số giả định về sự xuất hiện của không gian đơn vị không có trong Morse thực tế , ví dụ: bạn có thể có hai nhưng không nhất thiết phải có ba không gian đơn vị liền kề (không hợp lệ Morse). Chế độ xem ternary mua cho bạn một phân tích nhanh về khả năng giải mã độc đáo. Chế độ xem sâu / hiệu quả nhất là chế độ xem 3 hoặc 4 biểu tượng thực sự được biểu thị bằng số lượng bit không bằng nhau như trong mã Morse thực (| dit| = 2, | dah| = 4, | letter-space| = 3 và |word-space| = 6 hoặc 7); Ở cấp độ thấp này vẫn còn sâu sắc để coi các biểu tượng ternary / quernary là chuyển tiếp trong một máy tự động.

Về lý do tại sao Wikipedia hút về điều này ... cũng về một số chủ đề nó chỉ làm. Bài viết chính của họ trên http://en.wikipedia.org/wiki/Coding_theory không thực sự là thứ tôi khuyên bạn nên đọc. Tôi không thể nói nhiều về cuốn sách (Petzold) mà bạn đã đề cập ngoài cuốn sách không xuất hiện được viết bởi một chuyên gia về lý thuyết thông tin. Petzold chỉ đúng theo nghĩa là nếu các tin nhắn được mã hóa Morse chỉ bao gồm một chữ cái, bạn có thể nói một cách hợp lý rằng chúng nằm trong một số mã nhị phân; nếu bạn muốn gửi các từ mặc dù, bạn cần một dấu phân cách chữ cái, nếu không thì mã sẽ không phải là UD, đến mức không thực tế.


letter-spaceletter-spaceditdahletter-spaceT={10,1110,00}. Điều đó cũng có nghĩa là (ví dụ) kích thước của 'e' chỉ có 4 bit, không phải 5 bit.


Vui lòng chuyển bất kỳ cuộc trò chuyện nào nữa sang chat.stackexchange.com/rooms/21638/ từ
Logic lang thang

Bình luận không dành cho thảo luận mở rộng; cuộc trò chuyện này đã được chuyển sang trò chuyện .
Raphael

-1

Ban đầu mã Morse được dự định là dấu viết trên một dải giấy, nhưng các nhà khai thác điện báo đã sớm có thể "đọc" các nhấp chuột của thiết bị. Phiên bản này của Morse (Mỹ hoặc "đất" Morse) có ba yếu tố "đánh dấu", dấu chấm, dấu gạch ngang và dấu gạch ngang dài.

Việc sử dụng International Morse trong thế kỷ trước, thông qua truyền dẫn vô tuyến, thường được mã hóa bằng tay (trên phím điện báo) và được giải mã bằng tai, bằng cách lắng nghe tiếng bíp do máy thu tạo ra. Các nhà khai thác có kỹ năng có thể nhận được tốt hơn so với những người không có kỹ năng và một số người có thể tạo mã dễ hiểu hơn so với những người khác. Một nhà điều hành truyền dẫn tốt được cho là có "nắm đấm tốt". Một toán tử inept được gọi là LID. . https://english.stackexchange.com/questions/31818/how-did-the-word-lid-come-to-mean-poor-operator-in-the-context-of-telegraph .)

Do đó, việc "mã hóa" Morse thành định dạng nhị phân phụ thuộc vào mục đích, và do đó liệu chất lượng của "nắm tay tốt" so với "nắm tay kém" có được giữ lại hay không. Là một chuỗi các công tắc bật tắt được khớp với đồng hồ và "được sửa" cho những khó khăn về pha hoặc thời lượng của từng phần của tín hiệu? Hoặc thay vào đó, nó được lấy mẫu ở một tỷ lệ đủ để giữ lại các biến thể ngẫu nhiên hoặc khó hiểu, có lẽ là để kiểm tra sau này hoặc thỏa thích?


1
Xin lỗi, làm thế nào điều này trả lời câu hỏi?
Koray Tugay
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.