Tôi đang bảo quản một bản thảo được viết bởi cha tôi. Các tệp dữ liệu nằm trên đĩa mềm 5.25 ". Tôi đã đọc thành công các tệp từ các đĩa, nhưng cả hai chúng tôi đều không biết định dạng ngôn ngữ đánh dấu là gì. Nó được sử dụng bởi các nhà xuất bản sách vào đầu những năm 1990.
Dưới đây là một vài dòng từ một trong các tập tin.
\m\m<ps;3><l>\
<ep>\
{cn}1 \
{ct}Rethinking Universality:<qa>\
Six Cases<lrh;;1>Rethinking Universality: Six
Cases<xlrh><rrh;;2>Rethinking Universality: Six Cases<xrrh> \
{t1}In 1983 the anthropological community was convulsed by reactions to
Derek Freeman\'s <ital>Margaret Mead and Samoa: The Making and Unmaking
of a Myth.<med> Remarkably, two books with a very similar message but
by different authors attacking different myths were published within a
year of Freeman\'s. One was Melford Spiro\'s <ital>Oedipus in the
Trobriands<med> (1982); the other was Ekkehart Malotki\'s <ital>Hopi
Time<med> (1983). Each of these books refutes or questions one of the
centerpieces of anthropological relativism.\
%In <ital>Coming of Age in Samoa<med> (1928) Margaret Mead argued that
adolescence among Samoans was not the time of storm and stress that it
is in the West and, hence, that the Western conception of adolescence
is strictly cultural\Msomething that we could change. Freeman shows
that adolescence was just as stressful in Samoa as in the West and that
in other ways Samoa was not so different from Western societies as Mead
had led us to believe.\
Bất cứ ai cũng có thể xác định ngôn ngữ đánh dấu đang được sử dụng ở đây?
Tôi có cả những tập tin gốc và cuốn sách được xuất bản. Tôi sẽ không khó để hiểu được ý nghĩa của các mã. Nhưng nếu định dạng có thể được xác định, một số loại trình dịch tự động thành thứ gì đó gần đây hơn (RTF, XML, v.v.) có thể có sẵn.
Chỉnh sửa
Nó giống như một bí ẩn cần được giải quyết! Đây là cách một bảng được bắt đầu:
<begtab;tbl2;1p><setnc;2><setctr;5p><tblwidth;15p><setbgut;rsidbox;0q>
Tôi đã làm một số Googling xung quanh cho các điều khoản như begtab
và setbgut
. Cái sau xuất hiện một tài liệu PDF có vẻ như có "lỗi đánh máy", nhưng lỗi đánh máy là một setbgut
thẻ gần giống như tài liệu trong các tệp của tôi.
http://sfmb.ulb.ac.be/pdf/J_Biol_Chem_1999_274_22_15510.pdf (tìm kiếm setbgut
)
Nó sẽ xuất hiện bài nghiên cứu này được đặt ra bằng cách sử dụng cùng một phần mềm. Tôi đã mang nó vào Acrobat và các thuộc tính nói rằng nó được tạo bởi Xyvision Parlance Publisher (XPP). Đây là thứ tốt nhất tôi tìm thấy về chúng cho đến nay: http://www.isgmlug.org/n2-1/n2-1-49.htm
Chỉnh sửa 2
OK tôi nhìn thấy bây giờ. XPP là ngôn ngữ đánh dấu giống SGML. Trên thực tế, tài liệu bán hàng XPP quảng cáo mức độ "dễ dàng" của việc lấy một tài liệu SGML hiện có và thêm các thẻ độc quyền của họ. Thật không may, XPP đã được bán cho General Dynamics vài năm trước. Tự động dịch tài liệu sang HTML, rất khó nếu không có DTD. Tuy nhiên, như những người khác đã chỉ ra, hầu hết các thẻ đều dễ dàng tìm ra. Một số trong số chúng, chẳng hạn như các tài liệu tham khảo thư mục và các giá trị sau dấu chấm phẩy trong các thẻ như <rrh;1>
và <lp;&-1q>
vẫn còn trốn tránh tôi. Tôi sẽ phải so sánh các tệp với bản sao cứng vật lý cạnh nhau để giải mã tất cả.
lrh
và rrh
đang chạy đầu, tương ứng trái và phải. xlrh
và xrrh
thoát khỏi chế độ đầu đang chạy. cn
trung tâm một số trong đó như là ct
trung tâm một tiêu đề. ital
đưa bạn vào chế độ in nghiêng trong khi med
đưa bạn trở lại chế độ trung bình. %
bắt đầu một đoạn mới trong đó dấu gạch chéo ngược chỉ tiếp tục đoạn đó. Tôi không thể tìm ra những người khác, và đã thực hiện một số thuật ngữ tìm kiếm nhưng không có cụm từ nào tiết lộ định dạng ...