Tôi đang cố gắng sao chép và dán văn bản từ tệp PDF.
Tuy nhiên, bất cứ khi nào tôi dán văn bản gốc, đó là một mớ hỗn độn các ký tự bị cắt xén. Văn bản trông như sau (đây chỉ là một trích xuất nhỏ):
4$/)5=$13! ,4&1*%-! )5'$! 1$2$)&,$40! 65))! .*5)1! -#$! )/'8*/8$03!
(4/+$6&4;0!/'1!-&&)0!*0$1!.9!/,,)5%/-5&'!1$2$)&,$403!5'!+*%#!-#$!
0/+$!6/9! -#/-! &,$4/-5'8! 090-$+! 1$2$)&,$40! .*5)1!1$25%$! 1452$40!
/'1! &-#$4! 090-$+! 0&(-6/4$! %&+,&'$'-0! *0$1! .9! /,,)5%/-5&'!
1$2$)&,$40!-&1/97!"#$!+5M!&(!,4&1*%-!)5'$!/'1!,4&1*%-!1$2$)&,$40!
65))! .$!+*%#!+&4$! $2$')9! ./)/'%$13! #&6$2$43! -#/'! -#$!+5M! &(!
&,$4/-5'8!090-$+!/'1!/,,)5%/-5&'!1$2$)&,$40!-&1/97!
)*+*+, C<88,?>8513AG<5A14,
Tôi đã thử nó trong cả trình đọc PDF của Adobe và Foxit. Tôi đã thực hiện 'Lưu dưới dạng văn bản' trong Adobe Reader và tệp văn bản kết quả là cùng một văn bản bị cắt xén.
Bất kỳ ý tưởng làm thế nào tôi có thể đưa văn bản này ra không bị cắt xén? (Khác với nhập thủ công ... có rất nhiều văn bản để trích xuất.)