B
B
bychok3002017-02-11 12:03:26
Python
bychok300, 2017-02-11 12:03:26

How to parse txt file using Python3?

There is a .txt file with articles from the news, looks something like this:

Совет федерации-публикации в газетах, журналах
Новый глава Бурятии прибыл по транспортной линии
08.02.2017 08:00 Коммерсантъ
Вячеслав Наговицын добровольно покинул пост 
Глава Бурятии Вячеслав Наговицын, чей срок полномочий истекал в мае, вчера объявил о своей отставке. Его сменил замминистра транспорта РФ Алексей Цыденов, который, как и ставший накануне врио главы Пермского края Максим Решетников, работал в правительстве Владимира Путина. Сегодня внеплановую пресс-конференцию проведет белгородский губернатор Евгений Савченко, срок его полномочий истекает в октябре. 
Вячеслав Наговицын (срок полномочий истекал в мае) ушел в отставку по сценарию покинувшего накануне свой пост пермского губернатора Виктора Басаргина -- заявил о своем увольнении на внеплановой пресс-конференции. "Если помните, в законодательстве написано, что два срока должно быть, и я отработал полных два срока. Формально есть возможность пойти на третий срок, но ситуация подсказывает, что республике нужны перемены. Считаю, что я честно отработал два срока, и этого достаточно. Должна быть ротация",-- объяснил он. Господин Наговицын добавил, что его новое место работы пока не определено. 
Через несколько часов Владимир Путин предложил возглавить республику замминистра транспорта Алексею Цыденову, возможность его назначения в республику обсуждалась давно. Господин Цыденов, как и возглавивший накануне Пермский край глава департамента экономической политики и развития Москвы Максим Решетников, работал в правительстве Владимира Путина (см. справку). Президент предложил ему назвать первые шаги, чтобы "люди почувствовали движение вперед". "Первое, нужно формировать занятость: то, что быстро,-- это животноводство и туризм; с более длительными сроками -- развитие месторождений полезных ископаемых. И, безусловно, все-таки международный туристический потенциал",-- ответил Алексей Цыденов. 
Глава республиканского отделения КПРФ, сенатор от Иркутской области Вячеслав Мархаев, потенциальный конкурент господина Цыденова на выборах (пройдут в сентябре), назвал врио "кандидатурой достойной, ничем в Бурятии не прикормленной и ни от кого не зависящей". "Не думаю, что, после того как коммунист победил на губернаторских выборах в Иркутской области, Кремль будет приветствовать, чтобы "покраснел" весь Байкальский регион, поэтому борьба на выборах будет интересной",-- заявил "Ъ" господин Мархаев. Отметим, что коммунисты и справороссы критиковали Вячеслава Наговицына, в частности, за то, что до назначения в республику в 2007 году он не имел к ней отношения. 
По мнению политолога Александра Кынева, десять лет у власти в Бурятии Вячеслав Наговицын провел "вполне разумно и грамотно" на фоне других губернаторов-"варягов". "Чем плохи варяги? Приезжает человек, не знающий регион, тащит за собой команду, те тащат своих товарищей, подрядчиков, бизнес-интересы. С Наговицыным ничего этого не было. Человек пытался строить команду на месте в очень сложном регионе со сложной национальной элитой",-- пояснил он. При этом Алексея Цыденова, отметил эксперт, едва ли можно назвать варягом: "В территорию расселения бурятского этноса входит и Забайкалье, из которого родом Цыденов, и Иркутская область. Буряты тесно связаны и активно взаимодействуют. Учитывая специфику общения в бурятской среде, люди оттуда не теряют контактов". 
В Пермском крае вчера прошло представление Максима Решетникова. Он отметил, что прошел серьезную управленческую школу, работая под началом двух бывших пермских губернаторов -- Юрия Трутнева и Олега Чиркунова, а также мэра Москвы Сергея Собянина. Виктор Басаргин обратился к депутатам, топ-менеджерам предприятий, главам муниципалитетов с просьбой поддержать Максима Решетникова: "Региону сейчас как никогда необходимы экономическая, социальная и политическая стабильность, которой в последнее время нам так не хватало". Виктор Басаргин пообещал, что его новая работа "так или иначе будет связана" с Пермским краем. По сведениям "Ъ", рассматривается вариант с делегированием экс-губернатора в Совет федерации после сентябрьских выборов главы региона. 
Максим Решетников объявил, что сам возглавит правительство края. Должность главы правительства была упразднена Виктором Басаргиным в январе. "Никаких кардинальных решений по составу правительства нет, шанс будет у каждого. Требования есть, планка задана, кто будет соответствовать этой планке -- будут работать",-- пообещал врио главы. 
Как и предполагал "Ъ" накануне, должность главы департамента экономической политики и развития Москвы, ставшую вакантной после ухода Максима Решетникова, занял Владимир Ефимов, руководивший департаментом городского имущества. Департамент имущества в свою очередь возглавил заместитель господина Ефимова Максим Гаман. 
Эстафету губернаторских пресс-конференций подхватил глава Белгородской области Евгений Савченко, который неожиданно назначил на сегодня брифинг. Его тема не раскрывается, мероприятие несколько раз переносилось. 66-летний Евгений Савченко -- рекордсмен по пребыванию во власти в губернаторском корпусе. Он руководит Белгородской областью бессменно с 1993 года. В последнем рейтинге ФоРГО находился в группе губернаторов с "очень высоким рейтингом" и занимал 7-е место. 
Отдел политики 
http://www.kommersant.ru/doc/3212933 

and there are several hundreds of such articles in one file.
The task is this, you need to select these articles and save them to a new file. I noticed that these articles are separated by 2 newlines.
the question is how to run through the document, look for these two newline translations, copy everything before them and upload to a new file, then delete the copied part from the original document and move on.

Answer the question

In order to leave comments, you need to log in

1 answer(s)
A
Astrohas, 2017-02-11
@bychok300

import re
splited_file = open(output_path, 'w', encoding = 'utf-8')

with open("файл.txt") as f:
    articles = re.split(r'\n\s*\n', f.read(), flags=re.M)
    
for i in range(len(articles)):
    article = articles[i]
    file_name = "{}{}.txt".format(article[:20],str(i))
    file = open(file_name, mode='w')
    file.write(article)
    file.close()

Didn't find what you were looking for?

Ask your question

Ask a Question

731 491 924 answers to any question