Копируем фрагмент PDF-файла в Word. Как выделить и скопировать текст из PDF документа

Данные, извлеченные из PDF-файлов, используйте в собственных документах или электронных таблицах. Копирование данных из одного электронного документа в другой должно быть предсказуемым, как, например, процесс, изображенный на рисунке. Попытка скопировать данные из PDF-документа, однако, может оказаться неудачной. Наилучшим решением для пользователей Acrobat 6 и Adobe Reader в Windows является использование Acrobat 5.

Программа Adobe Acrobat 5 содержит превосходное дополнение для выделения текста/таблиц - TAPS. Adobe Acrobat 6 его не имеет. Поскольку дополнения к программе Acrobat являются модульными, можно скопировать TAPS-папку (под названием Table) из папки Acrobat 5 plug_ins (см. ) и вставить ее в папку Acrobat 6 plug_ins. Вот так-то! У вас нет Acrobat 5? Лицензия TAPS разрешает его свободное распространение. Посетите сайт http://www.pdfhacks.com/TAPS/, ознакомьтесь с лицензией и загрузите копию. У вас нет и Acrobat 6? Используйте Adobe Reader вместо этой программы. Дополнение TAPS работает и в Adobe Acrobat и в Adobe Reader.

Adobe Reader 5 и 6

В имеется простой инструмент Text Select (Выделение текста), который хорошо работает с отдельными строками текста. Чтобы выделить нужный фрагмент текста, удерживайте нажатыми клавиши Alt (Версия 6) или Ctrl (Версия 5) и вытягивайте прямоугольник выделения. Многострочные параграфы, скопированные с помощью этого инструмента, не сохраняют свой формат, и будучи вставленной в программу Word каждая строка становится отдельным параграфом.

Поэтому лучше использовать дополнение TAPS, которое точно копирует параграфы и таблицы. Скопируйте полную папку Table из каталога дополнений к программе Adobe Acrobat 5 (например, C:\Program Files\Adobe\Acrobat 5.0\Acrobat\plug_ins\Table) в каталог дополнений к программе Adobe Reader (например, C:\Program Files\Adobe\Acrobat 6.0\ Reader\plug_ins). Перезапустите программу Reader.

Если у вас нет Acrobat 5, посетите сайт http://www.pdfhacks.com/TAPS/ и скачайте файл архива Acrobat _5_TAPS.zip. Разархивируйте его, а затем поместите папку TAPS в каталог plugjns программы Reader. Перезапустите программу. Теперь у вас есть инструмент выделения таблиц/форматированного текста, как показано на рисунке.

Советы по использованию TAPS

  • Adobe Acrobat 5

Программа Adobe Acrobat 5 содержит такой же инструмент Text Select (Выделение текста), как и Adobe Reader. Используйте его для копирования небольших фрагментов неформатированного текста, как было описано выше.

Для того чтобы копировать форматированный текст, например параграфы, столбцы и таблицы, используйте инструмент Table\Formatted Text Select (Таблица\Форматированный текст). Он сохраняет формат параграфа и стиль текста. Проверьте его параметры настройки командой меню Edit\Preferences\Table\Formatted Text (Правка\Параметры настройки\Таблица\Форматированный текст) и убедитесь, что они соответствуют вашим целям.

Выберите инструмент TAPS, затем растяните прямоугольник вокруг текста, который хотите скопировать. Отпустите кнопку мыши, и прямоугольник выделения превратится в зону изменяемого размера. Есть два типа зон: Table (Таблица) (синяя) и Text (Текст) (зеленая). Если автоматическое определение инструмента создает неправильный тип зоны, щелкните правой кнопкой мыши на ней и в контекстном меню выберите нужный тип.

Скопируйте выбранный текст или таблицу в буфер обмена или поместите в целевую программу.

  • Adobe Acrobat 6

С выделением текста в Adobe Acrobat 6 что-то пошло не так, как надо: фирма Adobe опустила инструмент выделения таблиц/форматированного текста и добавила инструмент Select Table (Выделение таблицы). Этот инструмент работает медленно и плохо во многих документах формата PDF.

Решение состоит в том, чтобы получить копию дополнения TAPS и установить ее в Adobe Acrobat 6. Предыдущий раздел «Adobe Reader 5 и 6» объясняет, как найти и установить TAPS, а раздел «Adobe Acrobat 5» - как использовать ее.

Владелец PDF-документа может запретить копирование текста документа. В таких случаях инструменты выделения текста будут заблокированы. См. раздел «Шифрование и расшифровка PDF-документов (без помощи Adobe Acrobat)», где обсуждаются вопросы PDF-безопасности.

Выделение текста на отсканированных страницах

Если страницы вашего документа - растровые изображения, а не текст, попробуйте использовать инструмент Paper Capture OCR. Он конвертирует изображение страницы в оперативный текст, хотя качество преобразования зависит от четкости растрового изображения. Проверить, является ли страница растровым изображением, можно, активизировав инструмент Text Select (Выделение текста) и затем выделив весь текст командой Edit\Select All (Правка\Выделить все). Если страница имеет какой-либо текст, инструмент выделит его. Если ничего не выделено, но страница содержит текст, то это, вероятно, растровое изображение.

Иногда текст страницы создается с помощью векторной графики. Этот вид текста не является оперативным текстом (поэтому вы не можете копировать его) и не поддается оптическому распознаванию символов.

Пользователи Adobe Acrobat 6 могут копировать PDF-документ, используя команду меню Start Capture\Paper Capture\Document (Начало сбора данных\Сбор данных с бумаги\Документ). В отличие от Acrobat 5, Acrobat 6 не имеет никакого встроенного предела количества страниц, для которого можно применять оптическое распознавание символов.

Пользователи Adobe Acrobat 5 (в Windows) должны загрузить дополнение Paper Capture от Adobe. Откройте командой меню Tools\Download Paper Capture Plug-in (Сервис\3агрузить дополнение Paper Capture) веб-страницу с командами и ссылкой к странице загрузки. Или загрузите его непосредственно с веб-страницы http://www.adobe.com/support/downloads/detail.jsp?ftpID=1907. Это дополнение к программе выполняет оптическое распознавание символов только с 50 страниц PDF-документа за один раз.

Превосходно подходит для компактного хранения файлов. Это обстоятельство привело к тому, что формат PDF используется сейчас практически повсеместно, и почти на каждом компьютере установлено для его прочтения специальное приложение. Но если открытие такого документа не вызывает особых сложностей (в сети полно бесплатных программ), то при попытке копирования сохраненной в нем информации нередко возникают проблемы. Связано это с тем, что иногда авторы файлы решают поставить на него защиту. Как скопировать текст из PDF, если на нем стоит пароль? Выход есть, и таких способов несколько.

Виртуальный принтер

Стандартные установки безопасности позволяют при создании PDF-документа ограничить любое из следующих действий:

  • печать;
  • внесение в файл каких-либо изменений;
  • извлечение или копирования контента;
  • редактирование или добавление полей форм и комментариев.

Если автор решил защитить свой документ паролем, он может выбрать одну или несколько данных опций. Предположим, что выбрана третья опция (запрещено копирование), и вместе с тем пользователю доступен первый вариант (разрешена печать). Как скопировать текст из PDF в этом случае? Воспользоваться виртуальным принтером! Набрав в строке поиска слово «pdfforge», вы попадете на соответствующий сайт, на котором можно бесплатно скачать себе PDF-принтер. В принципе, не обязательно использовать именно это приложение. В интернете существует свыше миллиона похожих программ, так что даже самые привередливые юзеры смогут себе подобрать наиболее подходящий вариант. После установки такого приложения в списке установленных принтеров появится соответствующая иконка. Такой принтер можно использовать для создания PDF-файла практически из любого формата. И здесь мы подходим к самому интересному: если отправить на печать документ, защищенный паролем, то при этом будет создан новый PDF-документ, полностью лишенный всяких ограничений. Его как раз и можно будет использовать для копирования.

Сетевые сервисы

Первый вариант хорош для домашнего использования. Но что делать, если компьютер стоит на работе и на него запрещено устанавливать стороннее ПО, но при этом есть выход во всемирную паутину? Как скопировать текст из защищенного PDF в таком случае? Использовать сетевой сервис! В интернете в статьях на эту тему часто упоминают службу PDF Пират, которая способна справиться с любым документом, не превышающим по весу 150 мегабайт. При проверке оказалось, что она в настоящий момент не работает. Поэтому вот еще парочка вариантов: ресурс Pdfunlock и сервис FreeMyPDF. Несмотря на то, что эти сайты зарубежные и в интерфейсе нет русского языка, они способны освободить файл независимо от того, на каком языке хранится в нем текст.

Как справиться с «кракозябрами»?

Иногда пользователи сталкиваются с такой проблемой: после снятия защиты с PDF-документа и вставки скопированного текста в Word, вместо нормального текста появляются непонятные символы. Проблема состоит в неверно выбранной кодировке текста. Как скопировать из PDF, если в итоге получаются «крякозябры»? Самый простой способ - это повторное снятие пароля с файла через другой аналогичный сервис.

Софт

Поскольку вопрос «как скопировать текст из PDF» интересует многих, разработчики программ не могли оставить его без внимания. И по желанию можно ради эксперимента поставить себе PDF Password Remover, PDF Advanced Password Recovery, PDF Unlocker или любую другую утилиту подобного рода. Но их нужно сначала найти, затем скачать, разобраться, как та или другая работает… И все ради одного несчастного документа! Впрочем, случаи бывают разные, если ничто другое не помогает, а информация в документе действительно очень важна, то такой вариант будет, пожалуй, самым лучшим. Тем более что некоторые из таких программ не требуют установки, а значит, их можно будет запустить на рабочем компьютере и с обычной флешки.

Предупреждение

Хоть вышеперечисленные методы и описывают, как скопировать текст из PDF при наличии пароля, это вовсе не означает, что можно игнорировать действующее законодательство. Поэтому во избежание неприятностей желательно проверить, нет ли в защищенном документе заявления о конфиденциальности либо попросту посоветоваться с юристом.

Довольно часто используется для публикации разного рода электронных документов. В PDF публикуются научные работы, рефераты, книги, журналы и многое другие.

Сталкиваясь с документом в PDF формате, пользователи часто не знают, как скопировать текст в Ворд. Если у вас также возникла подобная проблема, то наша статья должна вам помочь. Здесь вы узнаете 4 способа, как скопировать текст из PDF в Ворд.

Самый простой способ скопировать текст из PDF в Ворд это обычное копирование, которым вы пользуетесь постоянно. Откройте ваш PDF файл в любой программе для просмотра PDF файлов (например, можно использовать Adobe Reader), выделите нужную часть текста, кликните по ней правой кнопкой мышки и выберите пункт «Копировать».

Также вы можете скопировать текст с помощью комбинации клавиш CTRL-C. После копирования текст можно вставить в Ворд или любой другой текстовый редактор.

К сожалению, данный способ копирования текста далеко не всегда подходит. от копирования, тогда вам не удастся выполнить копирование текста. Также в PDF документе могут быть таблицы или картинки, которые нельзя просто так скопировать. Если вы столкнулись с подобной проблемой, то следующие способы копирования текста из ПДФ должны вам помочь.

Копируем текст из PDF файла в Word с помощью ABBYY FineReader

ABBYY FineReader это программа для распознавания текста. Обычно данную программу используют для распознавания текста на отсканированных изображениях. Но, с помощью ABBYY FineReader можно распознавать и PDF файлы. Для этого откройте ABBYY FineReader, нажмите на кнопку «Открыть» и выберите нужный вам PDF файл.

После того как программа закончит распознавание текста нажмите на кнопку «Передать в Word».

После этого перед вами должен открыться документ Ворд с текстом из вашего PDF файла.

Копируем текст из PDF файла в Word c помощью конвертера

Если у вас нет возможности воспользоваться программой ABBYY FineReader, то можно прибегнуть к программам-конвертерам. Такие программы позволят конвертировать PDF документ в Word файл. Например, можно использовать бесплатную программу .

Для того чтобы сконвертировать PDF документ в Word файл с помощью UniPDF вам нужно просто открыть программу, добавить в нее нужный PDF файл, выбрать конвертацию в Word и нажать на кнопку «Convert».

Копируем текст из PDF файла в Word с помощью онлайн конвертеров

Также существуют онлайн конвертеры, которые позволяют сконвертировать PDF файл в Word файл. Обычно такие онлайн конвертеры работают хуже, чем специализированные программы, но они позволят скопировать текст из PDF в Ворд без установки дополнительного софта. Поэтому их также нужно упомянуть.

Использовать такие конвертеры довольно просто. Все что вам нужно сделать, это загрузить файл и нажать на кнопку «Конвертировать». А после завершения конвертации нужно будет скачать файл обратно.

Популярные онлайн конвертеры из PDF в Word.

Чтобы скопировать текст из файла формата PDF, необходимо провести некоторые простые процедуры. Какие именно, мы сейчас расскажем.

Как скопировать текст в простом файле

Как скопировать текст из PDF проще всего? Если в PDF просто текст, а не текст в виде картинки, то посмотрите на верхнюю панель программы. Если там найдете значок с большой буквой «T», то смело жмите на него. Это инструмент «Select text», после выбора его вы можете копировать нужный текст и потом вставлять в Word.

Если есть Adobe Reader, откройте PDF-документ при помощи этой программы, и сможете скопировать текст. Если же эти варианты невозможны, то нужно попробовать скопировать текст иначе.

Перед тем как скопировать текст из PDF, нужно выбрать в Интернете программу, которая переведёт документ из формата PDF в обычный текстовый документ. Подобных программ-помощников существует много, их можно скачать, а можно и провести процедуру перевода в режиме онлайн. Такими программами можно пользоваться бесплатно. Просто вставляете необходимый вам текст в окно на сайте, указываете свою электронную почту, прикрепляете файл с документом PDF и получаете письмо с текстовым документом.

Можно загрузить на компьютер программу, которая распознает файл и конвертирует его в простой текстовый документ из формата PDF в формат doc. Программа называется «ABBYY FineReader». Вот в этой программе и открывайте ваш файл. Загрузите файл в программу, она распознает и сконвертирует документ. Сохраните его в Word. Теперь можно читать и пользоваться файлом без путаницы и странных символов.

Работа с защищённым файлом

Можно столкнуться с такой проблемой, как защита от копирования или перевода в документе PDF. Скопировать текст не удаётся, а информация просто необходима. Что же делать, если скопировать текст из защищенного PDF просто не получается? Необходимо снять защиту, перевести документ в формат doc способом, указанным выше. Введите в поисковике запрос «программа для снятия защиты с PDF файла» и найдите подходящую. Нужный документ требуется перенести в окно программы, нажать на кнопку «Снять защиту» или «Снять кодировку» (зависит от ресурса, которым вы пользуетесь). Снимите ограничения - защиту с файла, сохраните его в Word. Или в окне может быть указано «Загрузить файл». Нажимаете на окно, выбираете нужный документ, нажимаете «Ок».

Можно, конечно, использовать вирусы, которые снимают защиту с документа PDF. Но это небезопасно, поскольку имеется вероятность, что после использования такого способа перевести файл в формат doc не получится.

Возможно, вам не удастся скопировать текст из PDF с помощью программы, которую вы используете. В таком случае нужно попытаться воспользоваться другими программами. Методом проб найдите оптимальную программу, даже если она англоязычная. Такие программы переводят файлы и на русском языке.

Привет всем! Сегодня делюсь информацией, как текст в пдф скопировать в ворд с возможностью его правки в документе.

Вставить содержимое в документ не так уж и сложно, но вот что мы получим после вставки это вопрос. Рассмотрим два наиболее известных способа.

Внедрение файла в документ

Вставка файла как объекта (Вставка - Объект) позволяет добавить, точнее, внедрить файл пдф в документ ворда в неизменном виде. Но будет отображаться только первая страница pdf-документа и для просмотра остальных страниц он будет доступен только при двойном клике на нем. После этого внедренный файл откроется во внешней программе-просмотрщике таких файлов, который установлен на вашем компьютере по умолчанию.

Плюсы этого метода: Быстро. Сохраняется все исходное форматирование вставленного текста с картинками.

Минусы : Видна только первая страница, для просмотра нужна внешняя программа. Если вы отправляете такой документ кому-то, то адресат должен догадаться, что это не одна страница и по ней нужно кликнуть для просмотра всего содержимого.

Вставка текстового содержимого копированием

Здесь необходимо любым известным вам способом скопировать текст из пдф файла и вставить его в документ Word. Можно скопировать фрагмент или все сразу (CTRL+A). При вставке содержимого выбирайте команду Сохранить исходное форматирование .


Способы вставки фрагмента текста при копировании

Это простые способы вставки содержимого пдф, которые требуют некоторого усилия для приведения текста в нормальный вид. Но в интернете вы можете найти сервисы по преобразованию pdf в Word. Но они не всегда дают ожидаемый результат, и правка форматирования возможно у вас отнимет не меньше времени, чем описанный выше способ. Или же установить на компьютер специальную программу распознавания, которую еще нужно будет освоить. Ну, если вам не срочно, то можно и так. Пробуйте и решайте, что удобнее для вас.

Решение проблемы

Если вы обладатель , то при открытии документ PDF в них будет автоматически преобразован в редактируемый формат. Ставьте последние версии Word.

Дорогой читатель! Вы посмотрели статью до конца.
Получили вы ответ на свой вопрос? Напишите в комментариях пару слов.
Если ответа не нашли, укажите что искали .