Ngôn ngữ đánh dấu này là gì? (khoảng năm 1991)


19

Tôi đang bảo quản một bản thảo được viết bởi cha tôi. Các tệp dữ liệu nằm trên đĩa mềm 5.25 ". Tôi đã đọc thành công các tệp từ các đĩa, nhưng cả hai chúng tôi đều không biết định dạng ngôn ngữ đánh dấu là gì. Nó được sử dụng bởi các nhà xuất bản sách vào đầu những năm 1990.

Dưới đây là một vài dòng từ một trong các tập tin.

\m\m<ps;3><l>\
<ep>\
{cn}1 \
{ct}Rethinking Universality:<qa>\
Six Cases<lrh;;1>Rethinking Universality: Six
Cases<xlrh><rrh;;2>Rethinking Universality: Six Cases<xrrh> \
{t1}In 1983 the anthropological community was convulsed by reactions to
Derek Freeman\'s <ital>Margaret Mead and Samoa: The Making and Unmaking
of a Myth.<med> Remarkably, two books with a very similar message but
by different authors attacking different myths were published within a
year of Freeman\'s. One was Melford Spiro\'s <ital>Oedipus in the
Trobriands<med> (1982); the other was Ekkehart Malotki\'s <ital>Hopi
Time<med> (1983). Each of these books refutes or questions one of the
centerpieces of anthropological relativism.\
%In <ital>Coming of Age in Samoa<med> (1928) Margaret Mead argued that
adolescence among Samoans was not the time of storm and stress that it
is in the West and, hence, that the Western conception of adolescence
is strictly cultural\Msomething that we could change. Freeman shows
that adolescence was just as stressful in Samoa as in the West and that
in other ways Samoa was not so different from Western societies as Mead
had led us to believe.\

Bất cứ ai cũng có thể xác định ngôn ngữ đánh dấu đang được sử dụng ở đây?

Tôi có cả những tập tin gốc và cuốn sách được xuất bản. Tôi sẽ không khó để hiểu được ý nghĩa của các mã. Nhưng nếu định dạng có thể được xác định, một số loại trình dịch tự động thành thứ gì đó gần đây hơn (RTF, XML, v.v.) có thể có sẵn.

Chỉnh sửa

Nó giống như một bí ẩn cần được giải quyết! Đây là cách một bảng được bắt đầu:

<begtab;tbl2;1p><setnc;2><setctr;5p><tblwidth;15p><setbgut;rsidbox;0q>

Tôi đã làm một số Googling xung quanh cho các điều khoản như begtabsetbgut. Cái sau xuất hiện một tài liệu PDF có vẻ như có "lỗi đánh máy", nhưng lỗi đánh máy là một setbgutthẻ gần giống như tài liệu trong các tệp của tôi.

http://sfmb.ulb.ac.be/pdf/J_Biol_Chem_1999_274_22_15510.pdf (tìm kiếm setbgut)

Nó sẽ xuất hiện bài nghiên cứu này được đặt ra bằng cách sử dụng cùng một phần mềm. Tôi đã mang nó vào Acrobat và các thuộc tính nói rằng nó được tạo bởi Xyvision Parlance Publisher (XPP). Đây là thứ tốt nhất tôi tìm thấy về chúng cho đến nay: http://www.isgmlug.org/n2-1/n2-1-49.htm

Chỉnh sửa 2

OK tôi nhìn thấy bây giờ. XPP là ngôn ngữ đánh dấu giống SGML. Trên thực tế, tài liệu bán hàng XPP quảng cáo mức độ "dễ dàng" của việc lấy một tài liệu SGML hiện có và thêm các thẻ độc quyền của họ. Thật không may, XPP đã được bán cho General Dynamics vài năm trước. Tự động dịch tài liệu sang HTML, rất khó nếu không có DTD. Tuy nhiên, như những người khác đã chỉ ra, hầu hết các thẻ đều dễ dàng tìm ra. Một số trong số chúng, chẳng hạn như các tài liệu tham khảo thư mục và các giá trị sau dấu chấm phẩy trong các thẻ như <rrh;1><lp;&-1q>vẫn còn trốn tránh tôi. Tôi sẽ phải so sánh các tệp với bản sao cứng vật lý cạnh nhau để giải mã tất cả.


Chà, đó không phải là TeX, RTF hay SGML. Bạn có biết nó được viết bằng tay hoặc được tạo bởi trình xử lý văn bản không?
Kevin Reid

1
Có lẽ là viết tay. Đánh dấu là quá ngắn gọn để được tạo ra bởi máy tính. Nó có thể đã được viết bởi một chương trình máy tính cho phép người dùng kiểm soát rất cụ thể các mã định dạng, tuy nhiên - sẽ chỉ còn một bước nữa là được mã hóa bằng tay.
Barry Brown

1
Việc mở rộng tên tập tin sẽ giúp ích rất nhiều.
Joel Coehoorn

chọc nhanh quy tắc XyWrite và wordstar (sử dụng mã chấm). Có lẽ nó tốt hơn?
Journeyman Geek

4
lrhrrhđang chạy đầu, tương ứng trái và phải. xlrhxrrhthoát khỏi chế độ đầu đang chạy. cntrung tâm một số trong đó như là cttrung tâm một tiêu đề. italđưa bạn vào chế độ in nghiêng trong khi medđưa bạn trở lại chế độ trung bình. %bắt đầu một đoạn mới trong đó dấu gạch chéo ngược chỉ tiếp tục đoạn đó. Tôi không thể tìm ra những người khác, và đã thực hiện một số thuật ngữ tìm kiếm nhưng không có cụm từ nào tiết lộ định dạng ...
Tamara Wijsman

Câu trả lời:


4

Tôi tìm thấy bản PDF này trên Xyvision Production Publisher (có khả năng là những gì đã được sử dụng). Lưu ý trong FinalPages, nó liệt kê HTML dưới dạng định dạng đầu ra.

Nếu bạn bằng cách nào đó có thể có được một bản sao của một số phiên bản của phần mềm này đang chạy, bạn có thể lấy nó để nhổ một số HTML. Điều đó có thể hoặc không khó hơn kỹ thuật đảo ngược đánh dấu tài liệu. Có thêm một chút thông tin về xuất khẩu HTML ở cuối trang này .

nhập mô tả hình ảnh ở đây


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.