Перейти к содержанию

Компьютерная Техника и программы


Рекомендуемые сообщения

Опубликовано

Прочитать текст из док-файла потребует на порядок больше усилий, чем сама задача. Или на 2 порядка. Так что проще текст скопировать и вставить куда-то.

  • Ответов 5.2 тыс
  • Создана
  • Последний ответ

Топ авторов темы

  • Outlawif

    641

  • andreyyy

    437

  • Cardopusher

    361

  • Faust

    329

Топ авторов темы

Опубликовано

не

без интернета и копирования! :bt:

Опубликовано

Я могу написать павершелл скрипт, но это уже не 2 строчки ))

Опубликовано

от заняться тебе нечем) лучше б для форума вставку видео с фб и инсты написал

Опубликовано
заняться тебе нечем
Та вообще-то есть... Но челенж же ))

 

Не могу все равно приаттачить ps1 файл, но я написал ))

 

Показать
$word = New-Object -ComObject Word.application
$document = $word.Documents.Open($pwd.Path + "\" + $args[0], $false, $true)
$text = $document.Words | select -Property Text | Select-String -Pattern '[абвгдеёжзиклмнопрстуфхцчшщ0-9]+' | %{$_.Line.Replace('@{Text=', '').Replace('}', '').Trim()} | Sort | Get-Unique

Write-Host 'Уникальных слов: ', $text.count
Out-File -FilePath .\words.txt -InputObject $text -Encoding unicode

 

Чтобы пользоваться, нужно открыть блокнот, скопировать туда код, сохранить как *.ps1 файл, потом запустить его, параметром передать имя док-файла (он должен лежать в той же директории). Подробные инструкции писать не мое, записал видео как пользоваться )) Видос по ссылке

 

Работает медленно, потому что для открытия док-файла создает оболочку ворда и потом работает с его внутренними объектами. Но от размера файла быстродействие зависит не сильно, просто оверхед большой на этот ворд. И еще ньюанс - работает только с русским текстом, считает слова и буквы. Иностранные слова за слова не считает ) Можно усовершенствовать, но требования расплывчатые...

 

Опубликовано

Кстати, а продвинутые текстовые редакторы типа Notepad++, Sublime Text, Vim случайно не умеют подобное? В том же нотепаде есть поддержка регулярок и продвинутый поиск

notepad__.png

Может тут можно как-то посчитать

Опубликовано

Чистой регуляркой у меня вышло только в питоне и си шарпе, даже жс с юникодом не справился, там пришлось дотачивать напильником. В жс \b не работает для юникода в регулярках и это все ломает. С английским текстом все куда проще, но мы хз что там за язык, мож вообще китайский, тогда надо править все скрипты )

 

Насколько сильная поддержка регулярок в этих ноутпадах я без понятия. Может и можно. Но это во-первых требует определенных навыков, во-вторых док-файлы это все не читает )

Опубликовано
во-вторых док-файлы это все не читает )
0utlaw,

ну мы уже пришли к мнению, что проще скопировать текст куда-то, чем костылить. Но ты завзятый и все равно накодил даже чтобы читать док файл. Маньяк короче

Опубликовано

Щас еще Котик скажет что док файл надо найти сначала поиском в гугле и скачать его на машину без инета. Вот тут я конечно призадумаюсь ))

Опубликовано

не, doc разбит на дискетах

поставь чтение с диска b:/

Создайте учетную запись или войдите, чтобы комментировать

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.

Войти
×
×
  • Создать...