[image]

Конвертация PDF в DOC или RTF

 
1 2 3

Alek

опытный
Собственно как это сделать быстро и без затей?
Может есть специальная прога?
   
+
-
edit
 
+
-
edit
 

Balancer

администратор
★★★★★
Adobe Acrobat. Открываешь и сохраняешь как текст :D

А файнридером я ещё толком ни разу не распознал PDF'ы :) На картинках и элементах вёрстки ему башню срывает :)
   

Alek

опытный
Файнридером я и делал. Трудности с картинками. Особенно если в них(в картинках) есть текст. Приходится ручками блоки выделять, а лень :)
   

semen

втянувшийся

Adobe Acrobat. Открываешь и сохраняешь как текст :D
 

Угу, только будь готов к тому, что каждая строка обязательно станет отдельным абзацем. В принципе, лечится написанем вордового макроса для объединения абзацев и визуальным контролем.
Дальше, возможно нарушение порядка следования текста — какая-нить трехстрочная табличная врезка внизу страницы или вроде-бы простенький список может разбиться на самостоятельные элементы, которые вклинятся в самые разные места, а то и переползут на другую страницу. Не часто, но такое бывает, так что, опять же, проверка глазами.

Всякие PDF-примочки от verypdf.com или BCL тоже не панацея. Да, абзацы они объедиянют. Только далеко не всегда корректно, да и списки при этом зачастую сливаются, куча лишних пробелов, бардак со стилями... Или, как и заявляется, полностью сохраняют форматирование исходного документа. Только вот при этом каждая строка текста вставлется в рамку - и че потом с ними делать, если документ переводить надо?

Так что мы, в основном, используем всякий экспорт PDF->doc для оценки объемов при переводе презентаций (ppt->pdf->doc и считаем кол-во знаковв ворде).

А файнридером я ещё толком ни разу не распознал PDF'ы :) На картинках и элементах вёрстки ему башню срывает :)
 

Угу, была (?) такая проблема до 7-ой версии, но, вроде, исчезла. По крайней мере, за последний месяц-полтора пока не сталкивался (это где-то 20-30 PDF'ов разных объемов и степени сложности). А те несколько PDF'ок, на которые FR6 ругался при попытке импорта некоторых страниц, будучи для интереса подсунуты седьмому прошли на ура.
Ну, разве что, осталась проблема корректного разбиения на блоки: то файнридер пытается распознать меню на скриншоте, то с табличкой у него напряг выходит... Тут уж опять ручками и глазками.


На самом деле, эт для меня тож больная тема, так что буду рад услышать новые мысли :)
   

Alek

опытный
У меня наверно акробат неправильный :)
Там нет функции сохранения в другом формате кроме PDF

А вот не пробывал ли кто прогу SolidConverter PDF 1.0 ?

Там около 15 мегов архив мне сложно это выкачать. Стоит ли?

Вот ЗДЕСЬ про нее прочитал

To semen - еще один переводчик в штат не требуется? :)
   

Alek

опытный
Вот оказывается есть русская версия ЗДЕСЬ
Наверно завтра утром попробую скачать, все таки, и посмотреть что к чему.

   
+
-
edit
 

Balancer

администратор
★★★★★
Alek, 07.05.2004 14:54:25 :
У меня наверно акробат неправильный :)
Там нет функции сохранения в другом формате кроме PDF
 


Ты Acrobat с Acrobat Reader ом не путаешь? :)

Вот, Adobe Acrobat 6.0
В меню "Save As" есть:
  • PDF
  • EPS
  • HTML 3.2
  • HTML 4 with CSS
  • JPEG
  • JPEG 2000
  • DOC
  • PNG
  • PS
  • RTF
  • TXT
  • TIFF
  • XML
  • XDP

Попробовал сохранить в TXT и HTML сложный трёхколоночный русский документ. Текст по колонкам поехал, но картиночки в HTML хорошо заэкспортировались :)
   

Alek

опытный
Balancer, 07.05.2004 14:20:53 :
Ты Acrobat с Acrobat Reader ом не путаешь? :)
 


Да точно у меня Acrobat Reader, а он похоже только для чтения?

Вот еще забавный совет дали (я уже попробовал) :)

> pdf2htmladobe.com
> pdf2txtadobe.com
> pdf2htmlsun.trace.wisc.edu
> pdf2txtsun.trace.wisc.edu

> Пишешь туда письмо, без темы, а в письме только URL pdf-файла.
> Пришлют конвертированный.
> это специальный робот и всякие hello не поймет
   

Vale

Сальсолёт
★☆
Ghostscript, кажется, такое умеет. PDF->PS точно, а уж из PS ...
   
LT Bredonosec #08.05.2004 00:07
+
-
edit
 
Насчет pdf2html - пробовал. Не знаю, как кому, может иногда и работала, у меня - в многостраничном (20стр) доке сделала только первую стр. со ссылками и всё. Далее, на ру-борде её неоднократно ругали, дескать, всё, что не понимает с налёту, сразу в картинки преображает. Сам после нескольких дней мучений потер эту пакость.
Правда, есть возможность, что говорим о разных прогах с одним названием. На той во время работы (конвертирования) в окошке(диалоге) лошадь скачущая была .

Для прикола вбил на кадете в поиск pdf, сразу 3 страницы результатов выкинуло. В смысле, софта с кряками. Взял на пробу пдф2ворд. Посмотрю, что скажет.
   
+
-
edit
 

Kestrel

опытный

[quote|Vale, 07.05.2004 21:51:30 :]Ghostscript, кажется, такое умеет. PDF->PS точно, а уж из PS ...[/quote]

Ghostcript точно умеет. Только ты людям ссылку на виндовую версию подкинь, а то замучются ;-) ( я уже не помню откуда качал)
   

semen

втянувшийся

Попробовал SolidConverter (2.0 build 100):
Очень порадовала возможность выбора режима преобразования, в т.ч. более-менее корректное объединение столбцов в одну колонку.
Недоработки с картинками — частенько пропускает, текст зачем-то на них отделяет. Не хватает, в общем, гибкости настройки в части обработки изображений. :)

А вот еще весьма неплохая тулза - Nothing found for Content Gemini . В ней особо примечатален режим разбиения PDF-странички на блоки для экспорта. Прям как в файнридере, только без косяков с распознаванием бежевого текста на светло-оранжевом фоне. :)
К сожалению пока не могу заставить ее полноценное работать без денег. Может найдется добрая душа помочь? :)
   
LT Bredonosec #17.05.2004 17:04
+
-
edit
 
Вот еще забавный совет дали (я уже попробовал) Пишешь туда письмо, без темы, а в письме только URL pdf-файла.
> Пришлют конвертированный
 

Ща попробовал -
1. Русский текст не понимает.
Page 1 2
яЮМЙР-оЕРЕПАСПЦЯЙХИ ЦНЯСДЮПЯРБЕММШИ СМХБЕПЯХРЕР
м. щ. цНКЪМДХМЮ
лЕРНД цСЯЕМХЖЮ -SSA: ЮМЮКХГ БПЕЛЕММШУ ПЪДНБ

с В Е А М Н Е О Н Я Н А Х Е


яЮМЙР-оЕРЕПАСПЦ 2003 1
 

2. Формул (то, на что хватило бы тегов <sub>, <sup>, [small], [html_font face=symbol]) - не понимает - пишет только те переменные, что можно обозначить буквами латинницы нормального размера. остальное - ":"
Я B (X) = [ E 12( X) : : : : : E 12( X)]
 


Фактически, выглядит так, как экспорт в текст средствами самого акроридера, с добавлением
 

в начале и конце дока или

в начале каждого абзаца.

Итог - неприемлемо. :(
   
LT Bredonosec #17.05.2004 17:49
+
-
edit
 
semen
К сожалению пока не могу заставить ее полноценное работать без денег. Может найдется добрая душа помочь?
 
попробуй
это
ЗЫ. просьба не светить снаружи форума - бо аккаунт прибьют.
   
RU Alesandro #17.05.2004 18:54
+
-
edit
 

Alesandro
Серокой

координатор
★★★★
А как насчёт обратного проеобразования? Задача - перекрнвертитть виндовый хелп (.chm) в PDF. Проблема в том, что при печати Distiller не высвечивается в списке доступных принтеров. :(
   
RU Dem_anywhere #18.05.2004 17:35
+
-
edit
 

Dem_anywhere

аксакал
★☆
Ну есть дофига других принтеров, которые в PDF печатают...
   
+
-
edit
 

GrayCat

координатор

[quote|Alesandro, 17.05.2004 16:54:42 :]А как насчёт обратного проеобразования? Задача - перекрнвертитть виндовый хелп (.chm) в PDF.[/quote]

Попробовать проинсталлить [любой] PS-принтер, вывод направить в файл (получится *.PS), скормить его GhostScript-у...
   

TbMA

опытный

Проверено - WinPDF печатает хелпы в pdf
   
RU Alesandro #18.05.2004 20:20
+
-
edit
 

Alesandro
Серокой

координатор
★★★★
спасибо. Осталось найти программы. :)
Ушёл искать. :)
   
[quote|Alesandro, 17.05.2004 17:54:42 :]А как насчёт обратного проеобразования? Задача - перекрнвертитть виндовый хелп (.chm) в PDF.[/quote]

а chm как бы вообще должен обратно разбираться в html из-которого он был скомпилён. что-то для такого преобразования мне попадалось.
 
LT Bredonosec #19.05.2004 00:34
+
-
edit
 
CHM2PDF Pilot
_http://www.colorpilot.com/chm2pdf.html

Document2PDF Pilot
_http://www.colorpilot.com/document2pdf.html
Ошибка :: Компьютерный форум Ru.Board


CHM To PDF Converter is a program that easily and fast converts CHM (Compiled Help Filesl) files to PDF format. It converts automatically the CHM Table of Contents to PDF Outline and consolidates all associated topic files in a single PDF. It supports the usual PDF features, including compression and 128 bit encryption.
_http://www.theta-software.com/chmtopdf.htm
а chm как бы вообще должен обратно разбираться в html из-которого он был скомпилён. что-то для такого преобразования мне попадалось
 

ABC Amber CHM Converter

Most likely, ABC Amber CHM Converter is a batch decompiler for Compiled Windows HTML Help files (*.chm) you've been searching for a long time. Taking CHM files or CHM ebooks, it will convert them to any document format you wish - PDF, RTF, HTML, DOC, TXT, MCW, etc.

_http://www.thebeatlesforever.com/processtext/abcchm.html
   
+
-
edit
 

Balancer

администратор
★★★★★
[quote|ab, 18.05.2004 21:47:30 :]а chm как бы вообще должен обратно разбираться в html из-которого он был скомпилён. что-то для такого преобразования мне попадалось.[/quote]

hh.exe -decompile filename.chm
   
RU Alesandro #19.05.2004 12:26
+
-
edit
 

Alesandro
Серокой

координатор
★★★★
[quote|Bredonosec, 19.05.2004 00:34:35 :]CHM2PDF Pilot
_http://www.colorpilot.com/chm2pdf.html[/quote]

Спасибо.
Скачал, поставил. Картинки теряет, и подписи к ним тоже. Видать, что-то не учёл в настройках.
Разбираюсь...
   
[quote|Balancer, 19.05.2004 08:25:12 :][quote|ab, 18.05.2004 21:47:30 :]а chm как бы вообще должен обратно разбираться в html из-которого он был скомпилён. что-то для такого преобразования мне попадалось.[/quote]

hh.exe -decompile filename.chm[/quote]

ага, вспомнил. но чуть-чуть не так, надо еще и каталог куда декомпилить указать

hh -decompile folder chm

where -decompile is the switch, folder is the name of the destination folder where you want the decompiled files to be copied, and chm is the name of the compiled help file you want to decompile.
 
1 2 3

в начало страницы | новое
 
Поиск
Настройки
Твиттер сайта
Статистика
Рейтинг@Mail.ru