Tôi nên sử dụng đối chiếu SQL Server nào cho tiếng Do Thái trong Kinh thánh? Cơ sở dữ liệu đang được xem xét cần phải phù hợp với dấu phụ (nghĩa là nguyên âm, dấu trọng âm, trope, v.v.).
Tôi nên sử dụng đối chiếu SQL Server nào cho tiếng Do Thái trong Kinh thánh? Cơ sở dữ liệu đang được xem xét cần phải phù hợp với dấu phụ (nghĩa là nguyên âm, dấu trọng âm, trope, v.v.).
Câu trả lời:
Thứ nhất: Không có sự phân biệt, đối chiếu-khôn ngoan, giữa tiếng Do Thái trong Kinh thánh và tiếng Do Thái hiện đại. Chúng tôi chỉ đang đối phó với tiếng Do Thái.
Thứ hai: Bất kể điều gì khác, bạn muốn sử dụng bộ đối chiếu mới nhất, đó là Thông thường tôi khuyên bạn nên sử dụng phiên bản mới nhất của bất kỳ đối chiếu nào bạn cần, nhưng ít nhất trong trường hợp này có lý do chính đáng để sử dụng phiên bản không có số phiên bản trong tên. Các đối chiếu phiên bản 100 (hoặc mới hơn) đã hoàn thiện hơn rất nhiều và có thể phân biệt giữa các ký tự bổ sung (hoặc thậm chí hỗ trợ đầy đủ nếu sử dụng _100_
loạt vì chúng có trọng lượng sắp xếp và quy tắc ngôn ngữ mới hơn / hoàn chỉnh hơn so với loạt cũ hơn không có số phiên bản trong tên (về mặt kỹ thuật là phiên bản 80
).SC
hoặc 140
đối chiếu), nhưng giả sử rằng bạn không xử lý các ký tự bổ sung, thì phiên bản 80 (không có phiên bản số trong tên) các bộ sưu tập thực hiện công việc xử lý tiếng Do Thái tốt hơn (xem mục "Thứ sáu" bên dưới).
Thứ ba: Không có khái niệm "Kana" (hoặc loại Kana) trong tiếng Do Thái, vì vậy bạn có thể bỏ qua bất kỳ biến thể đối chiếu nào _KS
trong tên của chúng (vì đó là độ nhạy mà bạn sẽ không bao giờ sử dụng).
Forth: Các bộ sưu tập kết thúc bằng các _SC
ký tự bổ sung hỗ trợ (ví dụ UTF-16 đầy đủ) vì vậy thường tốt nhất để chọn một trong số đó, nếu có (nghĩa là: nếu bạn đang sử dụng SQL Server 2012 hoặc mới hơn).
Thứ năm: Bạn không muốn đối chiếu nhị phân ( _BIN
hoặc _BIN2
) vì chúng không thể phân biệt giữa các chữ cái tiếng Hê-bơ-rơ có cả nguyên âm và dấu hiệu giống nhau nhưng có các ký tự kết hợp theo các thứ tự khác nhau, cũng không thể bỏ qua các nguyên âm và các dấu khác đánh đồng những thứ như א
và אֽ
.
Ví dụ: (nguyên âm và dấu hiệu kết hợp các ký tự theo thứ tự ngược nhau):
SELECT NCHAR(0x05D0) + NCHAR(0x059C) + NCHAR(0x05B8),
NCHAR(0x05D0) + NCHAR(0x05B8) + NCHAR(0x059C)
WHERE NCHAR(0x05D0) + NCHAR(0x059C) + NCHAR(0x05B8) =
NCHAR(0x05D0) + NCHAR(0x05B8) + NCHAR(0x059C) COLLATE Hebrew_100_CS_AS_SC;
-- אָ֜ אָ֜
SELECT NCHAR(0x05D0) + NCHAR(0x059C) + NCHAR(0x05B8),
NCHAR(0x05D0) + NCHAR(0x05B8) + NCHAR(0x059C)
WHERE NCHAR(0x05D0) + NCHAR(0x059C) + NCHAR(0x05B8) =
NCHAR(0x05D0) + NCHAR(0x05B8) + NCHAR(0x059C) COLLATE Hebrew_100_BIN2;
-- no rows
Thứ sáu: Nó phụ thuộc vào cách bạn sẽ tương tác với các giá trị chuỗi. Tiếng Hê-bơ-rơ không có chữ in hoa / in thường, nhưng có một vài điểm mã bị ảnh hưởng bởi phân biệt chữ hoa chữ thường. Thậm chí có một vài điểm mã nhạy cảm với chiều rộng. Nhạy cảm / không nhạy cảm ảnh hưởng đến dấu phụ được sử dụng cho nguyên âm, phát âm và dấu hiệu chói tai (tức là trope).
Bạn có cần phân biệt giữa hình thức cuối cùng và không cuối cùng của cùng một chữ cái không? Có năm chữ cái trong tiếng Do Thái trông khác nhau khi được sử dụng làm chữ cái cuối cùng của một từ. SQL Server xử lý việc này thông qua phân biệt chữ hoa / _CS
chữ thường
SELECT NCHAR(0x05DE) AS [Mem],
NCHAR(0x05DD) AS [Final Mem]
WHERE NCHAR(0x05DE) = NCHAR(0x05DD) COLLATE Hebrew_CI_AS_KS_WS;
-- 1 row (expected; all sensitive except case)
-- Mem Final Mem
-- מ ם
SELECT NCHAR(0x05DE) AS [Mem],
NCHAR(0x05DD) AS [Final Mem]
WHERE NCHAR(0x05DE) = NCHAR(0x05DD) COLLATE Hebrew_CS_AI;
-- no rows (expected; all insensitive except case)
SELECT NCHAR(0x05DE) AS [Mem],
NCHAR(0x05DD) AS [Final Mem]
WHERE NCHAR(0x05DE) = NCHAR(0x05DD) COLLATE Hebrew_100_CI_AI;
-- no rows (expected 1 row; all insensitive)
Bạn có cần phân biệt giữa các dấu phát âm, nguyên âm và dấu cộng hưởng không? SQL Server xử lý việc này thông qua _AS
các lần thu thập / độ nhạy cảm (mặc dù, thật không may, nó dường như bị phá vỡ trong các phiên bản mới hơn và thường tốt hơn, phiên bản 100 và mới hơn). Xin lưu ý rằng cả ba trong số này được nhóm lại với nhau theo độ nhạy của giọng nói và không thể được kiểm soát một cách riêng biệt (nghĩa là bạn không thể đánh dấu nguyên âm nhạy cảm nhưng không nhạy cảm).
Dấu phát âm
Có một số chữ cái có hai âm thanh khác nhau. Đôi khi, chỉ báo duy nhất cho âm thanh được sử dụng là ngữ cảnh của từ đó trong từ (và đôi khi ngay cả các từ xung quanh), chẳng hạn như trong Torah thực tế (nơi không có dấu phát âm hoặc nguyên âm). Nhưng, cùng một văn bản trong các hình thức khác, cũng như các văn bản khác, sẽ có các dấu chấm được đặt bên trong chữ cái hoặc cho chữ Shin, phía trên chữ cái. Chữ Shin có thể có âm "sh" hoặc "s". Để chỉ ra âm "sh" (tức là chữ "shin"), có một dấu chấm ở phía bên phải, trong khi dấu chấm ở phía bên trái biểu thị âm "s" (chữ "sin"):
SELECT NCHAR(0x05E9) AS [Shin], -- ש
NCHAR(0x05E9) + NCHAR(0x05C1) AS [Shin + Shin Dot], -- שׁ
NCHAR(0x05E9) + NCHAR(0x05C2) AS [Shin + Sin Dot] -- שׂ
WHERE NCHAR(0x05E9) = NCHAR(0x05E9) + NCHAR(0x05C1) COLLATE Hebrew_CS_AI_KS_WS
AND NCHAR(0x05E9) = NCHAR(0x05E9) + NCHAR(0x05C2) COLLATE Hebrew_CS_AI_KS_WS;
-- 1 row (expected; all sensitive except accent)
SELECT NCHAR(0x05E9) AS [Shin], -- ש
NCHAR(0x05E9) + NCHAR(0x05C1) AS [Shin + Shin Dot], -- שׁ
NCHAR(0x05E9) + NCHAR(0x05C2) AS [Shin + Sin Dot] -- שׂ
WHERE NCHAR(0x05E9) = NCHAR(0x05E9) + NCHAR(0x05C1) COLLATE Hebrew_CI_AS
OR NCHAR(0x05E9) = NCHAR(0x05E9) + NCHAR(0x05C2) COLLATE Hebrew_CI_AS;
-- no rows (expected; all insensitive except accent)
SELECT NCHAR(0x05E9) AS [Shin], -- ש
NCHAR(0x05E9) + NCHAR(0x05C1) AS [Shin + Shin Dot], -- שׁ
NCHAR(0x05E9) + NCHAR(0x05C2) AS [Shin + Sin Dot] -- שׂ
WHERE NCHAR(0x05E9) = NCHAR(0x05E9) + NCHAR(0x05C1) COLLATE Hebrew_100_CI_AI_SC
OR NCHAR(0x05E9) = NCHAR(0x05E9) + NCHAR(0x05C2) COLLATE Hebrew_100_CI_AI_SC;
-- no rows (expected 1 row; all insensitive)
Nguyên âm
SELECT NCHAR(0x05D0) AS [Aleph], -- א
NCHAR(0x05D0) + NCHAR(0x05B8) AS [Aleph with vowel] -- אָ
WHERE NCHAR(0x05D0) =
NCHAR(0x05D0) + NCHAR(0x05B8) COLLATE Hebrew_CS_AI_KS_WS;
-- 1 row (expected; all sensitive except accent)
SELECT NCHAR(0x05D0) AS [Aleph], -- א
NCHAR(0x05D0) + NCHAR(0x05B8) AS [Aleph with vowel] -- אָ
WHERE NCHAR(0x05D0) =
NCHAR(0x05D0) + NCHAR(0x05B8) COLLATE Hebrew_CI_AS;
-- no rows (expected; all insensitive except accent)
SELECT NCHAR(0x05D0) AS [Aleph], -- א
NCHAR(0x05D0) + NCHAR(0x05B8) AS [Aleph with vowel] -- אָ
WHERE NCHAR(0x05D0) =
NCHAR(0x05D0) + NCHAR(0x05B8) COLLATE Hebrew_100_CI_AI_SC;
-- no rows (expected 1 row; all insensitive)
Dấu hiệu lưu hóa
Về mặt kỹ thuật, theo dữ liệu Unicode chính thức, các dấu hiệu cộng hưởng tiếng Do Thái là không thể biết được và chỉ nên đăng ký như một sự khác biệt ở đây khi sử dụng đối chiếu nhị phân. Tuy nhiên, SQL Server đối xử với chúng giống như dấu (không may) và không thể bỏ qua chúng tách biệt với dấu phát âm hoặc nguyên âm.
SELECT NCHAR(0x05D0) AS [Aleph], -- א
NCHAR(0x05D0) + NCHAR(0x05A8) AS [Aleph with cantillation mark] -- א֨
WHERE NCHAR(0x05D0) =
NCHAR(0x05D0) + NCHAR(0x05A8) COLLATE Hebrew_CS_AI_KS_WS;
-- 1 row (expected; all sensitive except accent)
SELECT NCHAR(0x05D0) AS [Aleph], -- א
NCHAR(0x05D0) + NCHAR(0x05A8) AS [Aleph with cantillation mark] -- א֨
WHERE NCHAR(0x05D0) =
NCHAR(0x05D0) + NCHAR(0x05A8) COLLATE Hebrew_CI_AS;
-- no rows (expected; all insensitive except accent)
SELECT NCHAR(0x05D0) AS [Aleph], -- א
NCHAR(0x05D0) + NCHAR(0x05A8) AS [Aleph with cantillation mark] -- א֨
WHERE NCHAR(0x05D0) =
NCHAR(0x05D0) + NCHAR(0x05A8) COLLATE Hebrew_100_CI_AI_SC;
-- no rows (expected 1 row; all insensitive)
Bạn có cần phân biệt giữa các hình thức rộng và không rộng của cùng một chữ cái không? Có tám chữ cái trong tiếng Do Thái được kéo dài (rộng) nhưng chỉ nhằm mục đích sử dụng trong cuộn Torah (viết tay / thực hoặc in) để giữ định dạng cột được chứng minh đầy đủ (thực ra là cách nó xuất hiện trong cuộn Torah ). SQL Server xử lý việc này thông qua độ nhạy / độ rộng _WS
(đủ thú vị, dường như là độ nhạy duy nhất hoạt động chính xác trong phiên bản mới hơn 100 và các đối chiếu mới hơn, mặc dù đáng buồn thay, nó ít được sử dụng nhất):
SELECT NCHAR(0x05DC) AS [Lamed],
NCHAR(0xFB25) AS [Wide Lamed]
WHERE NCHAR(0x05DC) = NCHAR(0xFB25) COLLATE Hebrew_CI_AI;
-- no rows (expected 1 row; all insensitive)
SELECT NCHAR(0x05DC) AS [Lamed],
NCHAR(0xFB25) AS [Wide Lamed]
WHERE NCHAR(0x05DC) = NCHAR(0xFB25) COLLATE Hebrew_100_CS_AS_KS_SC;
-- 1 row (expected; all sensitive except width)
-- Lamed Wide Lamed
-- ל ﬥ
SELECT NCHAR(0x05DC) AS [Lamed],
NCHAR(0xFB25) AS [Wide Lamed]
WHERE NCHAR(0x05DC) = NCHAR(0xFB25) COLLATE Hebrew_100_CI_AI_WS_SC;
-- no rows (expected; all insensitive except width)
Vì vậy, có lẽ Hebrew_CI_AI
cho các cột, và bạn có thể ghi đè lên mỗi biểu hiện / ngữ thông qua COLLATE
tuyên bố nếu bạn cần phải sử dụng một biến thể, chẳng hạn như COLLATE Hebrew_CS_AI
hay Hebrew_CI_AS
hay Hebrew_CS_AS
.
Ghi chú bổ sung
Bạn sẽ cần lưu trữ dữ liệu trong NVARCHAR
các cột / biến. Bạn có thể thực hiện hầu hết điều này trong 8 bit thông thường VARCHAR
bằng cách sử dụng trang mã Windows-1255 (đó là những gì tất cả các bộ Hebrew_*
sưu tập sử dụng), bao gồm kết hợp các ký tự cho nguyên âm và dấu chấm phát âm:
;WITH Hebrew AS
(
SELECT NCHAR(0x05E9) + NCHAR(0x05C1) + NCHAR(0x05B8)
COLLATE Hebrew_100_CS_AS AS [Shin]
)
SELECT
Hebrew.[Shin] AS [Unicode],
CONVERT(VARCHAR(20), Hebrew.[Shin]) AS [CodePage1255],
CONVERT(VARBINARY(10), CONVERT(VARCHAR(20), Hebrew.[Shin])) AS [CodePage1255_bytes]
FROM Hebrew;
-- Unicode CodePage1255 CodePage1255_bytes
-- שָׁ שָׁ F9D1C8
Tuy nhiên, chỉ có khối tiếng Do Thái Unicode chứa các dấu cộng hưởng (ví dụ: trope; điểm mã U + 0591 đến U + 05AF) cộng với một vài bổ sung (điểm mã U + 05C4 đến U + 05C7) và khối Biểu mẫu bảng chữ cái chứa rộng biến thể của một số chữ cái cộng với một số công cụ khác.
Theo các quy tắc chính thức của Unicode CLDR (thiết kế riêng cho từng địa phương) đối với văn hóa tiếng Do Thái ("anh ấy" và "anh ấy IL"), U + 05F3 HEBREW PUNCTUATION GERESH nên khớp hoặc đến trước , U + 0027 APOSTROPHE. Thông thường, U + 05F3 sắp xếp sau dấu nháy đơn. Hành vi này thực sự được nhìn thấy khi sử dụng bản demo đối chiếu ICU và chuyển đổi giữa thứ tự "gốc" / thứ tự tiêu chuẩn (được sử dụng bởi tiếng Anh Mỹ / "en-US") và "anh ấy". Tuy nhiên, hành vi này dường như không khả dụng trong .NET hoặc SQL Server:
SELECT NCHAR(0x05F3)
WHERE NCHAR(0x05F3) <= N'''' COLLATE Hebrew_100_CS_AS_KS_WS;
-- no rows
SELECT NCHAR(0x05F3)
WHERE NCHAR(0x05F3) <= N'''' COLLATE Hebrew_CS_AS_KS_WS;
-- no rows
Mặc dù thiếu sót đáng tiếc, nhưng thật hợp lý khi tôi không thấy bất kỳ sự điều chỉnh cụ thể nào của "anh ấy" hoặc "anh ấy" trong các tệp Bảng sắp xếp trọng lượng của Windows. Điều này rất có thể có nghĩa là không có sự khác biệt thực sự giữa Hebrew_*
và các bộ Latin1_General_*
sưu tập bên ngoài trang mã được liên kết, chỉ được sử dụng cho VARCHAR
dữ liệu và không áp dụng ở đây.
OP trả lời:
Có, tôi cần phân biệt giữa: 1) hình thức cuối cùng và không phải cuối cùng của cùng một chữ cái 2) dấu phát âm 3) nguyên âm và 4) dấu hiệu chói tai.
Trong trường hợp đó, vì bạn không cần bỏ qua sự khác biệt giữa các thuộc tính đó, bạn có thể sử dụng các đối chiếu 100 cấp. Ví dụ dưới đây cho thấy một chữ cái tiếng Hê-bơ-rơ (Sin) có dấu phát âm, dấu cộng hưởng và nguyên âm. Có sáu phiên bản để có thể trình bày từng tổ hợp sắp xếp thứ tự các ký tự kết hợp. Có một mục thứ bảy sử dụng dấu chấm khác để tạo chữ Shin với cùng một chữ cái cơ bản, nguyên âm và dấu cộng. Truy vấn cho thấy chỉ có sáu mục "Tội lỗi" khớp với nhau (ngay cả với các lệnh byte khác nhau), nhưng không phải là "Shin".
Tôi đã bao gồm việc sử dụng Latin1_General
và Japanese_XJIS_140
đối chiếu để chỉ ra rằng các quy tắc cũng hoạt động với các quy tắc đó trong trường hợp bạn cần sử dụng chúng (các 140
đối chiếu, chỉ bằng tiếng Nhật, có nhiều ánh xạ chữ hoa / chữ thường hơn các phiên bản cũ hơn). Nhưng nói chung, có lẽ tốt nhất để gắn bó với các bộ sưu tập tiếng Do Thái và sử dụng một 100
phiên bản không nếu bạn cần bỏ qua sự khác biệt về nguyên âm, nhãn hiệu, dấu chấm và hình thức cuối cùng so với hình thức cuối cùng.
DECLARE @Shin NVARCHAR(5) = NCHAR(0x05E9), -- base Hebrew letter
@Dot NVARCHAR(5) = NCHAR(0x05C2), -- Sin Dot
@Mark NVARCHAR(5) = NCHAR(0x05A8), -- Cantillation Mark (i.e. trope)
@Vowel NVARCHAR(5) = NCHAR(0x05B8); -- Vowel
DECLARE @Dot_Mark_Vowel NVARCHAR(20) = @Shin + @Dot + @Mark + @Vowel,
@Dot_Vowel_Mark NVARCHAR(20) = @Shin + @Dot + @Vowel + @Mark,
@Vowel_Dot_Mark NVARCHAR(20) = @Shin + @Vowel + @Dot + @Mark,
@Vowel_Mark_Dot NVARCHAR(20) = @Shin + @Vowel + @Mark + @Dot,
@Mark_Vowel_Dot NVARCHAR(20) = @Shin + @Mark + @Vowel + @Dot,
@Mark_Dot_Vowel NVARCHAR(20) = @Shin + @Mark + @Dot + @Vowel,
@ShinDot_Mark_Vowel NVARCHAR(20) = @Shin + NCHAR(0x05C1) + @Mark + @Vowel;
SELECT @Dot_Mark_Vowel AS [Sin], @ShinDot_Mark_Vowel AS [Shin];
;WITH chr AS
(
SELECT *
FROM (VALUES
(@Dot_Mark_Vowel, 'Dot + Mark + Vowel'),
(@Dot_Vowel_Mark, 'Dot + Vowel + Mark'),
(@Vowel_Dot_Mark, 'Vowel + Dot + Mark'),
(@Vowel_Mark_Dot, 'Vowel + Mark + Dot'),
(@Mark_Vowel_Dot, 'Mark + Vowel + Dot'),
(@Mark_Dot_Vowel, 'Mark + Dot + Vowel'),
(@ShinDot_Mark_Vowel, 'ShinDot + Mark + Vowel')
) tmp([Hebrew], [Description])
) SELECT chr1.[Hebrew],
'--' AS [---],
chr1.[Description] AS [Description_1],
CONVERT(VARBINARY(20), RIGHT(chr1.[Hebrew], 3)) AS [Bytes_1],
'--' AS [---],
chr2.[Description] AS [Description_2],
CONVERT(VARBINARY(20), RIGHT(chr2.[Hebrew], 3)) AS [Bytes_2]
FROM chr chr1
CROSS JOIN chr chr2
WHERE chr1.[Description] <> chr2.[Description] -- do not compare item to itself
AND chr1.[Hebrew] = chr2.[Hebrew] COLLATE Hebrew_100_CS_AS_SC
AND chr1.[Hebrew] = chr2.[Hebrew] COLLATE Latin1_General_100_CS_AS_SC
AND chr1.[Hebrew] = chr2.[Hebrew] COLLATE Japanese_XJIS_140_CS_AS;
-- this query returns 30 rows
Nó phụ thuộc vào rất nhiều thứ. Đối chiếu là sắp xếp, so sánh và trang mã không unicode.
Repo này có một danh sách tốt các tùy chọn xung quanh tiếng Do Thái.
+---------------------------+---------------------------------------------------------------------------------------------------------------------+
| Hebrew_BIN | Hebrew, binary sort |
| Hebrew_BIN2 | Hebrew, binary code point comparison sort |
| Hebrew_CI_AI | Hebrew, case-insensitive, accent-insensitive, kanatype-insensitive, width-insensitive |
| Hebrew_CI_AI_WS | Hebrew, case-insensitive, accent-insensitive, kanatype-insensitive, width-sensitive |
| Hebrew_CI_AI_KS | Hebrew, case-insensitive, accent-insensitive, kanatype-sensitive, width-insensitive |
| Hebrew_CI_AI_KS_WS | Hebrew, case-insensitive, accent-insensitive, kanatype-sensitive, width-sensitive |
| Hebrew_CI_AS | Hebrew, case-insensitive, accent-sensitive, kanatype-insensitive, width-insensitive |
| Hebrew_CI_AS_WS | Hebrew, case-insensitive, accent-sensitive, kanatype-insensitive, width-sensitive |
| Hebrew_CI_AS_KS | Hebrew, case-insensitive, accent-sensitive, kanatype-sensitive, width-insensitive |
| Hebrew_CI_AS_KS_WS | Hebrew, case-insensitive, accent-sensitive, kanatype-sensitive, width-sensitive |
| Hebrew_CS_AI | Hebrew, case-sensitive, accent-insensitive, kanatype-insensitive, width-insensitive |
| Hebrew_CS_AI_WS | Hebrew, case-sensitive, accent-insensitive, kanatype-insensitive, width-sensitive |
| Hebrew_CS_AI_KS | Hebrew, case-sensitive, accent-insensitive, kanatype-sensitive, width-insensitive |
| Hebrew_CS_AI_KS_WS | Hebrew, case-sensitive, accent-insensitive, kanatype-sensitive, width-sensitive |
| Hebrew_CS_AS | Hebrew, case-sensitive, accent-sensitive, kanatype-insensitive, width-insensitive |
| Hebrew_CS_AS_WS | Hebrew, case-sensitive, accent-sensitive, kanatype-insensitive, width-sensitive |
| Hebrew_CS_AS_KS | Hebrew, case-sensitive, accent-sensitive, kanatype-sensitive, width-insensitive |
| Hebrew_CS_AS_KS_WS | Hebrew, case-sensitive, accent-sensitive, kanatype-sensitive, width-sensitive |
| Hebrew_100_BIN | Hebrew-100, binary sort |
| Hebrew_100_BIN2 | Hebrew-100, binary code point comparison sort |
| Hebrew_100_CI_AI | Hebrew-100, case-insensitive, accent-insensitive, kanatype-insensitive, width-insensitive |
| Hebrew_100_CI_AI_WS | Hebrew-100, case-insensitive, accent-insensitive, kanatype-insensitive, width-sensitive |
| Hebrew_100_CI_AI_KS | Hebrew-100, case-insensitive, accent-insensitive, kanatype-sensitive, width-insensitive |
| Hebrew_100_CI_AI_KS_WS | Hebrew-100, case-insensitive, accent-insensitive, kanatype-sensitive, width-sensitive |
| Hebrew_100_CI_AS | Hebrew-100, case-insensitive, accent-sensitive, kanatype-insensitive, width-insensitive |
| Hebrew_100_CI_AS_WS | Hebrew-100, case-insensitive, accent-sensitive, kanatype-insensitive, width-sensitive |
| Hebrew_100_CI_AS_KS | Hebrew-100, case-insensitive, accent-sensitive, kanatype-sensitive, width-insensitive |
| Hebrew_100_CI_AS_KS_WS | Hebrew-100, case-insensitive, accent-sensitive, kanatype-sensitive, width-sensitive |
| Hebrew_100_CS_AI | Hebrew-100, case-sensitive, accent-insensitive, kanatype-insensitive, width-insensitive |
| Hebrew_100_CS_AI_WS | Hebrew-100, case-sensitive, accent-insensitive, kanatype-insensitive, width-sensitive |
| Hebrew_100_CS_AI_KS | Hebrew-100, case-sensitive, accent-insensitive, kanatype-sensitive, width-insensitive |
| Hebrew_100_CS_AI_KS_WS | Hebrew-100, case-sensitive, accent-insensitive, kanatype-sensitive, width-sensitive |
| Hebrew_100_CS_AS | Hebrew-100, case-sensitive, accent-sensitive, kanatype-insensitive, width-insensitive |
| Hebrew_100_CS_AS_WS | Hebrew-100, case-sensitive, accent-sensitive, kanatype-insensitive, width-sensitive |
| Hebrew_100_CS_AS_KS | Hebrew-100, case-sensitive, accent-sensitive, kanatype-sensitive, width-insensitive |
| Hebrew_100_CS_AS_KS_WS | Hebrew-100, case-sensitive, accent-sensitive, kanatype-sensitive, width-sensitive |
| Hebrew_100_CI_AI_SC | Hebrew-100, case-insensitive, accent-insensitive, kanatype-insensitive, width-insensitive, supplementary characters |
| Hebrew_100_CI_AI_WS_SC | Hebrew-100, case-insensitive, accent-insensitive, kanatype-insensitive, width-sensitive, supplementary characters |
| Hebrew_100_CI_AI_KS_SC | Hebrew-100, case-insensitive, accent-insensitive, kanatype-sensitive, width-insensitive, supplementary characters |
| Hebrew_100_CI_AI_KS_WS_SC | Hebrew-100, case-insensitive, accent-insensitive, kanatype-sensitive, width-sensitive, supplementary characters |
| Hebrew_100_CI_AS_SC | Hebrew-100, case-insensitive, accent-sensitive, kanatype-insensitive, width-insensitive, supplementary characters |
| Hebrew_100_CI_AS_WS_SC | Hebrew-100, case-insensitive, accent-sensitive, kanatype-insensitive, width-sensitive, supplementary characters |
| Hebrew_100_CI_AS_KS_SC | Hebrew-100, case-insensitive, accent-sensitive, kanatype-sensitive, width-insensitive, supplementary characters |
| Hebrew_100_CI_AS_KS_WS_SC | Hebrew-100, case-insensitive, accent-sensitive, kanatype-sensitive, width-sensitive, supplementary characters |
| Hebrew_100_CS_AI_SC | Hebrew-100, case-sensitive, accent-insensitive, kanatype-insensitive, width-insensitive, supplementary characters |
| Hebrew_100_CS_AI_WS_SC | Hebrew-100, case-sensitive, accent-insensitive, kanatype-insensitive, width-sensitive, supplementary characters |
| Hebrew_100_CS_AI_KS_SC | Hebrew-100, case-sensitive, accent-insensitive, kanatype-sensitive, width-insensitive, supplementary characters |
| Hebrew_100_CS_AI_KS_WS_SC | Hebrew-100, case-sensitive, accent-insensitive, kanatype-sensitive, width-sensitive, supplementary characters |
| Hebrew_100_CS_AS_SC | Hebrew-100, case-sensitive, accent-sensitive, kanatype-insensitive, width-insensitive, supplementary characters |
| Hebrew_100_CS_AS_WS_SC | Hebrew-100, case-sensitive, accent-sensitive, kanatype-insensitive, width-sensitive, supplementary characters |
| Hebrew_100_CS_AS_KS_SC | Hebrew-100, case-sensitive, accent-sensitive, kanatype-sensitive, width-insensitive, supplementary characters |
| Hebrew_100_CS_AS_KS_WS_SC | Hebrew-100, case-sensitive, accent-sensitive, kanatype-sensitive, width-sensitive, supplementary characters |
+---------------------------+---------------------------------------------------------------------------------------------------------------------+