Toderelt.ru

ПК Журнал ТодерельТ
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Как конвертировать PDF в Microsoft Excel 2007 или выше

Как конвертировать PDF в Microsoft Excel 2007 или выше

Microsoft еще не предложила способ создания электронной таблицы Excel из файла PDF. Это не значит, что нет способа сделать это. На самом деле существует простой вариант, позволяющий превратить ваш PDF-документ в редактируемый файл Excel. Вы можете использовать стороннее программное обеспечение для импорта данных из PDF-файла в электронную таблицу Excel.

Преобразование PDF в Excel

Как конвертировать XLS в PDF в Эксель

До момента появления версии 2010 года преобразование документов XLS в PDF-формат проводилось только сторонними программами или сервисными ресурсами. Но все версии, вышедшие после 2010 года, обладают встроенной функцией, позволяющей конвертировать файлы, находясь непосредственно в самом Эксель

Как преобразовать XLS в PDF в Эксель

  1. Для начала нужно выделить диапазон ячеек, который следует преобразовать, после чего щелкаем по меню «Файл». Здесь следует обратить внимание на настройки разметки страницы, чтобы вся выделяемая область попадала в активную область.

Импорт данных из PDF в Excel через Power Query

Задача переноса данных из таблицы в PDF-файле на лист Microsoft Excel — это всегда «весело». Особенно если у вас нет дорогих программ распознавания типа FineReader или чего-то подобного. Прямое копирование обычно ни к чему хорошему не приводит, т.к. после вставки скопированных данных на лист, они, скорее всего, «слипнутся» в один столбец. Так что их потом придется кропотливо разделять с помощью инструмента Текст по столбцам с вкладки Данные (Data — Text to Columns) .

И само-собой, копирование возможно только для тех PDF-файлов, где есть текстовый слой, т.е. с только что отсканированным с бумаги в PDF документом это не сработает в принципе.

Но все не так грустно, на самом деле 🙂

Если у вас Office 2013 или 2016, то за пару минут без дополнительных программ вполне можно реализовать перенос данных из PDF в Microsoft Excel. А помогут нам в этом Word и Power Query.

Для примера, давайте возьмем вот такой PDF-отчет с кучей текста, формул и таблиц с сайта Европейской Экономической Комиссии:

Исходный PDF

. и попробуем вытащить из него в Excel, скажем первую таблицу:

Нужная таблица в PDF

Шаг 1. Открываем PDF в Word

Почему-то мало кто знает, но начиная с 2013 года Microsoft Word научился открывать и распознавать PDF файлы (даже отсканированные, т.е. без текстового слоя!). Делается это совершенно стандартным образом: открываем Word, жмем Файл — Открыть (File — Open) и уточняем PDF-формат в выпадающем списке в правом нижнем углу окна.

Затем выбираем нужный нам PDF-файл и жмем Открыть (Open) . Word сообщает нам, что собирается запустить распознавание этого документа в текст:

Запуск распознавания PDF в Word

Соглашаемся и через несколько секунд увидим наш PDF открытым для редактирования уже в Word:

Распознанный PDF в Word

Само-собой, у документа частично слетит дизайн, стили, шрифты, колонтитулы и т.п., но для нас это не важно — нам нужны только данные из таблиц. В принципе, на этом этапе уже возникает соблазн дальше просто скопировать таблицу из распознанного документа в Word и просто вставить ее в Excel. Иногда это срабатывает, но чаще приводит ко всевозможным искажениям данных — например числа могут превратиться в даты или остаться текстом, как в нашем случае, т.к. в PDF используется не российские разделители:

Искаженные данные

Так что давайте не будем срезать углы, а сделаем все чуть сложнее, но правильно.

Этап 2. Сохраняем документ как веб-страницу

Чтобы потом загрузить полученные данные в Excel (через Power Query), наш документ в Word нужно сохранить в формате веб-страницы — этот формат является, в данном случае, неким общим знаменателем между Word’ом и Excel’ем.

Для этого идем в меню Файл — Сохранить как (File — Save As) или жмем клавишу F12 на клавиатуре и в открывшемся окне выбираем тип файла Веб-страница в одном файле (Webpage — Single file) :

Сохраняем как веб-страницу

После сохранения должен получиться файл с расширением mhtml (если у вас в Проводнике видны расширения файлов).

Этап 3. Загружаем файл в Excel через Power Query

Можно открыть созданный MHTML-файл в Excel напрямую, но тогда мы получим, во-первых сразу все содержимое PDF вместе текстом и кучей ненужных таблиц, а, во-вторых, опять потеряем данные из-за неправильных разделителей. Поэтому импорт в Excel мы будем делать через надстройку Power Query. Это совершенно бесплатная надстройка, с помощью которой можно загружать в Excel данные практически из любых источников (файлов, папок, баз данных, ERP-систем) и всячески затем полученные данные трансформировать, придавая им нужную форму.

Читать еще:  Как создать электронную почту Gmail.com — пошаговое руководство

Если у вас Excel 2010-2013, то скачать Power Query можно с официального сайта Microsoft — после установки у вас появится вкладка Power Query. Если у вас Excel 2016 или новее, то качать ничего не нужно — весь функционал уже встроен в Excel по-умолчанию и находится на вкладке Данные (Data) в группе Загрузить и преобразовать (Get & Transform) .

Так что идем либо на вкладку Данные, либо на вкладку Power Query и выбираем команду Получить данные или Создать запрос — Из файла — Из XML. Чтобы были видны не только XML-файлы — меняем в выпадающем списке в правом нижнем углу окна фильтры на Все файлы (All files) и указываем наш MHTML-файл:

Выбираем MHTML-файл для импорта в Excel

Обратите внимание, что импорт успешно не завершится, т.к. Power Query ждет от нас XML, а у нас, на самом деле, HTML-формат. Поэтому в следующем появившемся окне нужно будет щелкнуть правой кнопкой мыши по непонятному для Power Query файлу и уточнить его формат:

Уточняем настоящий формат файла

После этого файл будет корректно распознан и мы увидим список всех таблиц, которые в нем есть:

Выбираем таблицу для импорта

Посмотреть содержимое таблиц можно, если щелкать левой кнопкой мыши в белый фон (не в слово Table!) ячеек в столбце Data.

Когда нужная таблица определена, щелкните по зеленому слову Table — и вы «провалитесь» в её содержимое:

Нужная нам таблица

Останется проделать несколько простых действий, чтобы «причесать» ее содержимое, а именно:

  1. удалить ненужные столбцы (правой кнопкой мыши по заголовку столбца — Удалить)
  2. заменить точки на запятые (выделить столбцы, щелкнуть правой — Замена значений)
  3. удалить знаки равно в шапке (выделить столбцы, щелкнуть правой — Замена значений)
  4. удалить верхнюю строку (Главная— Удалить строки — Удаление верхних строк)
  5. удалить пустые строки (Главная — Удалить строки — Удаление пустых строк)
  6. поднять первую строку в шапку таблицы (Главная — Использовать первую строку в качестве заголовков)
  7. отфильтровать лишние данные с помощью фильтра

Когда таблица будет приведена в нормальный вид, ее можно выгрузить на лист командой Закрыть и загрузить (Close & Load) на Главной вкладке. И мы получим вот такую красоту, с которой уже можно работать:

Преобразование PDF в CSV с помощью Tabula

Действия и операция очень просты. Первый будет установить библиотеку Tabula в нашу среду разработки. Табула позволяет нам извлекать данные из таблиц в формате PDF в фреймы данных Pandas, библиотеку Python, оптимизированную для работы с CSV и массивами.

Это также позволяет извлекать и конвертировать между PDF, JSON, CSV и TSV. Драгоценный камень. Вы можете найти гораздо больше информации в репозиторий github

Я использую всю работу предыдущих дней и устанавливаю ее в Anaconda. По ссылке вы можете увидеть, как установить Anaconda.

Устанавливаем Табула

При его выполнении мне выдала ошибку

решение, указанное в их документации, заключалось в том, чтобы удалить старую версию Tabula и установить новую.

Создаем исполняемый файл .py

читать таблицы из pdf в csv

Я создаю исполняемый файл .py, который я называю pdftocsv.py, и помещаю его в свою папку Downloads / eltiempo, и это файл со следующим кодом

PDF-файл для чтения называется inforatge.pdf, и я говорю ему, что вывод называется out.csv, и он останется в папке, в которой мы работаем.

Мы переходим в каталог, в котором находятся исполняемый файл и PDF-файл, который мы хотим преобразовать. Это важно, потому что если он скажет нам, что не может найти файл.

В этом каталоге у нас есть PDF, файл .py, который мы создали, и там он вернет нужный нам CSV.

Обратите внимание, что я использовал python, то есть я говорю ему запускать его с python 2, а не с python3, который не работает. И все, если он не возвращает ни одной ошибки, она у нас уже есть.

запустить Tabula в нашей среде разработки Anaconda

Мы добавили в файл еще 3 строки для управления во время выполнения. в конце мы оставили наш файл pdftocsv.py как

Больше возможностей от Tabula

Еще примеры того, что мы можем сделать. Вариантов много, лучше всего пройти через официальный репозиторий Github, который я оставил

Читать еще:  Как открыть архив 7z

И, без сомнения, одна из самых полезных вещей для преобразования всех файлов PDF, JSON и т. Д. В каталоге.

Благодаря этому мы можем автоматизировать задачи, которые в противном случае были бы долгими и утомительными. В конце концов, это одна из причин использования этой библиотеки.

Как таблицу Excel конвертировать в PDF?

В Excel вы можете знать метод преобразования всей книги в файл PDF, но знаете ли вы, как преобразовать только одну таблицу в Excel в один файл PDF? В этой статье у меня есть несколько советов, как быстро решить эту задачу.

Преобразование одной таблицы в PDF или файлы другого формата с помощью Kutools for Excelхорошая идея3

Преобразование всех таблиц в отдельные файлы PDF с помощью Kutools for Excelхорошая идея3

Преобразование одной таблицы в PDF с помощью функции «Сохранить как»

В Excel вы можете использовать функцию «Сохранить как» для обработки задания.

1. Выберите таблицу, которую вы хотите преобразовать в PDF, нажмите Файл > Сохранить как > Приложения.
doc преобразовать таблицу в pdf 1

Если вы используете Excel 2010 или более раннюю версию, щелкните непосредственно Файл > Сохранить как.

2. в Сохранить как в окне выберите PDF из Сохранить как list и дайте файлу имя, затем щелкните Параметры.
doc преобразовать таблицу в pdf 2

3. в Параметры диалог, проверьте Выбор in Опубликовать какой раздел.
doc преобразовать таблицу в pdf 3

4. Нажмите OK > скидка. Теперь в PDF-файл преобразована только таблица.
doc преобразовать таблицу в pdf 4

Преобразование одной таблицы в PDF или файлы другого формата с помощью Kutools for Excel

Если вы хотите преобразовать одну таблицу из Excel в PDF, CVS или другие форматы, вы можете использовать Kutools for ExcelАвтора Export Range to File утилита, чтобы легко и быстро с этим справиться.

После установки Kutools for Excel, сделайте следующее: (Бесплатная загрузка Kutools for Excel прямо сейчас!)

1. Выберите таблицу, которую вы хотите преобразовать, нажмите Kutools Plus > Import/Export > Export Range to File .
doc преобразовать таблицу в pdf 5

2. в Export Range to File В диалоговом окне выберите формат файла, в который вы хотите преобразовать, и отметьте соответствующие параметры в правом разделе, затем выберите место для размещения файла результатов.
doc преобразовать таблицу в pdf 6

3. Нажмите Ok преобразовать выбранную таблицу в файл pdf.

Демонстрация: экспорт диапазона в файл

Преобразование всех таблиц в отдельные файлы PDF с помощью Kutools for Excel

Если на каждом листе есть одна таблица, которую необходимо преобразовать в отдельные файлы PDF, вы можете использовать Kutools for Excel’s Split Workbook функции.

После установки Kutools for Excel, сделайте следующее: (Бесплатная загрузка Kutools for Excel прямо сейчас!)

1. Активируйте книгу, которую хотите разделить на несколько файлов PDF, щелкните Kutools Plus > Workbook > Split Workbook .
doc преобразовать таблицу в pdf 7

2. в Split Workbook диалоговое окно, отметьте листы, которые вы хотите преобразовать, отметьте Save as type флажок и выберите PDF из раскрывающегося списка.
doc преобразовать таблицу в pdf 8

3. Нажмите Трещина, появится диалоговое окно для выбора местоположения.
doc преобразовать таблицу в pdf 9

4. Нажмите OK. Теперь каждый лист преобразован в отдельный файл PDF.
doc преобразовать таблицу в pdf 10

Онлайн способы перевода файлов pdf в excel

Преимущества, которые вы получаете при преобразовании PDF в Excel с помощью интернет-сервисов, заключаются в том, что вам не нужно устанавливать дополнительное приложение и вы можете делать это с любого устройства. Кроме того, все эти способы абсолютно бесплатны.

Просто следуйте инструкциям по преобразованию на выбранном вами сайте. Вот несколько рекомендуемых сайтов для преобразования PDF в Excel.

iLove PDF

Все так же, как и раньше, посетите сайт ilovepdf.com. После этого выберите файл, который хотите преобразовать, и убедитесь, что вы выбрали формат PDF, затем нажмите «Открыть». Подождите, пока ваш PDF-документ будет успешно загружен. Если все прошло успешно, нажмите кнопку «Преобразовать в Excel» и дождитесь завершения процесса преобразования.

Самые простые способы конвертировать PDF в файлы Excel

Затем выберите «Загрузить Excel», чтобы сохранить файл на своем устройстве, или воспользуйтесь параметрами Google Диска или другого облачного хранилища, если хотите сохранить его в Интернете.

PDF в Excel

Есть и другой способ — открыть сайт pdftoexcel.com. Через этот сайт вы можете конвертировать файлы PDF только в один формат, а именно в Excel. После открытия вы можете перетащить файл, который нужно преобразовать, затем нажмите «Загрузить» и выберите «Формат файла PDF».

Следующим шагом нажмите кнопку Открыть и дождитесь окончания процесса загрузки, чтобы завершить преобразование, если вы хотите, чтобы это было быстрее, вы можете использовать платную версию. В обратном случае не забудьте выбрать «Бесплатная загрузка», чтобы сохранить результаты преобразования.

Читать еще:  Как сделать мультяшный эффект в Photoshop не умея рисовать

HipdfPDF

Сайт, который не менее хорош для процесса конвертации — это hipdf.com. Чтобы загрузить документ, который нужно преобразовать в Excel, щелкните параметр «Выбрать файл» и выберите « Формат файла PDF» . Затем нажмите «Открыть» и дождитесь успешной загрузки файла.

hipdf приложение для конвертирования в эксель

Если это произошло, выберите «Преобразовать», подождите несколько секунд, прежде чем появится кнопка загрузки, выбрав «Загрузить». Готово, теперь ваш PDF-файл превратился в Excel.

Sodapdf

Следующий наиболее практичный способ — конвертировать файлы через веб-сайт sodapdf.com, который, предоставляет множество вариантов форматирования. Шаги действительно просты: перейдите на сайт и нажмите кнопку Выбрать PDF.

Когда документ будет найден, выберите «открыть» для загрузки. После успешной загрузки файл будет автоматически преобразован веб-сайтом в формат Excel. Дождитесь завершения процесса, затем нажмите «Загрузить» или выберите опцию «Отправить файлы по электронной почте».

Clever PDF

Собственно, вы можете сделать этот метод онлайн или офлайн, приложение также можно установить на компьютер с Windows и Mac. Но на этот раз этапы, представленные для онлайн-версии. Сайт вы найдете — cleverpdf.com.

Clever PDF

После посещения веб-сайта вы можете сразу загружать файлы, выбрав «Файл». Затем нажмите «Начать преобразование» , дождитесь завершения процесса и выберите «Загрузить».

Конвертация файлов pdf в excel через SmallPDF

Этот метод намного проще предыдущего. Вместо того чтобы копировать отдельные файлы вручную, вы можете загрузить редактируемый файл PDF на сайт SmallPDF.com. После загрузки сайт создаст версию XLS, которую вы можете редактировать, используя те же форматы столбцов и строк, что и оригинал.

Конвертация файлов pdf в excel через SmallPDF

Затем нажмите на опцию PDF to Excel, как на изображении выше. Нажмите Выбрать файл и выберите PDF-файл для преобразования. Вам будет предложено два варианта: «Преобразовать в Excel» и «Преобразовать в Excel с распознаванием текста». Выберите параметр «Преобразовать в Excel», потому что для вашего PDF-файла были выполнены предыдущие шаги распознавания текста.

Нажмите на опцию «Выбрать», и процесс конвертации начнется. Щелкните Загрузить, чтобы загрузить результат преобразования в формате XLSX.Откройте файл Excel с помощью Microsoft Excel. Таблица внутри была верна оригиналу — числа были в нужных строках и столбцах. Таким образом, вы можете сразу использовать таблицу без необходимости корректировки форматирования.

Часть 5: Часто задаваемые вопросы о PDF в Excel

Как вставить PDF в Excel?

Чтобы встроить PDF-файл в рабочий лист Excel, вы можете перейти к Excel. Вставить таб. выберите объект из Текст выпадающий список. в Создать новый раздел, выбрать Документ Adobe Acrobat . Убедитесь, что у вас установлен Adobe Reader. Проверить перед Отобразить как значок . Затем нажмите OK подтвердить. Теперь вы можете импортировать любой файл PDF в электронную таблицу Excel. Нажмите Откройте чтобы завершить процесс встраивания PDF в Excel.

Можете ли вы конвертировать PDF в Excel с помощью Microsoft Office?

Да. Вы также можете использовать Microsoft Office Word в качестве бесплатного конвертера PDF в Excel. Просто откройте файл PDF через Word. Нажмите OK для выхода из всплывающего окна. Нажмите Разрешить Редактирование вверху, чтобы закрыть режим защищенного просмотра. Разверните Файл список и выберите Сохранить как . Выбирать веб-страницы под Сохранить как , Позже, нажмите скидка и выйдите из Word. Используйте Microsoft Office Excel, чтобы открыть файл веб-страницы PDF. Вы можете просматривать и редактировать таблицы PDF непосредственно в Excel.

Как исправить слияние ячеек после преобразования PDF в Excel?

Функциональность Adobe PDF в Excel может привести к объединению ячеек и пустых столбцов. Сначала вы можете экспортировать PDF в Word. Позже вы можете скопировать таблицу из Word в электронную таблицу Google Диска. Наконец, вы можете скопировать Excel с Google Диска в Microsoft Office Excel.

Это все, чтобы преобразовать PDF в Excel и продолжить форматирование на мобильном телефоне или компьютере. Вы можете использовать онлайн- и офлайн-конвертеры PDF для извлечения таблиц и формул XLS и XLSX. Если в ваших файлах PDF есть несколько таблиц, рекомендуется использовать технологию Apeaksoft PDF Converter Ultimate OCR для получения наилучшего результата. После этого вы можете конвертировать PDF в Excel с помощью OCR для дальнейшего редактирования и просмотра.

голоса
Рейтинг статьи
Ссылка на основную публикацию
ВсеИнструменты
Adblock
detector