View previous topic :: View next topic |
Author |
Message |
astrolit
Joined: 26 Jul 2012 Posts: 42
|
(Separately) Posted: Sat Jul 28, 2012 23:15 Post subject: |
|
|
нет на второй подстановке спотыкается, "71" не является внутренней и т.д.
Code: | type *.htm |ssed -R -n s/.*(hotel_photos\/(12|71|83|100)\/[\d\/]+_740x550\.jpg).*/\1/p >imgs100.lst |
|
|
Back to top |
|
 |
Tol!k

Joined: 01 Apr 2008 Posts: 1727 Location: Арзамас
|
(Separately) Posted: Sat Jul 28, 2012 23:22 Post subject: |
|
|
нужны кавычки
Code: | type *.htm |ssed -R -n "s/.*(hotel_photos\/(12|71|83|100)\/[\d\/]+_740x550\.jpg).*/\1/p" >imgs.lst |
|
|
Back to top |
|
 |
astrolit
Joined: 26 Jul 2012 Posts: 42
|
(Separately) Posted: Sat Jul 28, 2012 23:25 Post subject: |
|
|
благодарю, есть ещё вопрос,
не ускорит ли процес если 4 командные панели одновременно будут вести поиск по одному большому 1.5 gb htm файлу, и вести запись каждый в свой лист,
и ещё такой момент поиск ведётся с начала документа но вот позиции 100,83, и 71 было бы удобно отбирать с конца |
|
Back to top |
|
 |
Tol!k

Joined: 01 Apr 2008 Posts: 1727 Location: Арзамас
|
(Separately) Posted: Sat Jul 28, 2012 23:37 Post subject: |
|
|
Quote: | 4 командные панели одновременно | учитывая одновременное обращение к HDD, скорее замедлит
НЯП работу sed, такое невозможно |
|
Back to top |
|
 |
astrolit
Joined: 26 Jul 2012 Posts: 42
|
(Separately) Posted: Sat Jul 28, 2012 23:45 Post subject: |
|
|
ну и ладнинько, всё очень даже работает.
Огромное спасибо.
тема может быть закрыта |
|
Back to top |
|
 |
Tol!k

Joined: 01 Apr 2008 Posts: 1727 Location: Арзамас
|
(Separately) Posted: Sun Jul 29, 2012 13:48 Post subject: |
|
|
с одним файлом лучше будет
Code: | >imgs.lst ssed -R -n "s/.*((\.\.\/){5}icache\/photos\/(12|71|83|100)\/[\d\/]+_740x550\.jpg).*/\1/p" file.htm |
странно, что не работает батник Quote: | просто мигает курсор | а размер imgs.lst в это время не растёт? |
|
Back to top |
|
 |
astrolit
Joined: 26 Jul 2012 Posts: 42
|
(Separately) Posted: Fri Aug 03, 2012 16:23 Post subject: |
|
|
"а размер imgs.lst в это время не растёт?" он вообще не создаётся, видать не туда я разместил батник....
но у меня другой вопрос, скажем сформировался документ imgs.lst,
и в нём есть похожие строки
Code: |
photos/83/999/87947/821709_740x550.jpg
photos/83/999/87947/821708_740x550.jpg
photos/83/15/88868/829347_740x550.jpg
photos/83/15/88868/829346_740x550.jpg
photos/83/15/88868/829345_740x550.jpg
photos/83/15/88868/829344_740x550.jpg
photos/83/15/88868/829343_740x550.jpg
|
можно ли как то ограничить(удалить лишние) количество схожих строк.
скажем не более 4 схожих строк, если 5 и более - удаляем? |
|
Back to top |
|
 |
Flasher

Joined: 06 Nov 2009 Posts: 14229 Location: Москва
|
(Separately) Posted: Sat Aug 04, 2012 19:23 Post subject: |
|
|
astrolit wrote: | скажем не более 4 схожих строк | А для чего такое кол-во? |
|
Back to top |
|
 |
astrolit
Joined: 26 Jul 2012 Posts: 42
|
(Separately) Posted: Sat Aug 04, 2012 23:48 Post subject: |
|
|
строк-ссылок более 65 000 шт. реально уникальных ссылок 10310 на каждый номер приходиться по 20 - 60 фото ссылок нужно ограничить до четырёх на уникальный! т.к. файлы картинок весят более 100 кб - во первых долго качать, а во вторых нагрузка на размещение под хостинг
Code: |
photos/83/15/88868/829347_740x550.jpg
photos/83/15/88868/829346_740x550.jpg
photos/83/15/88868/829345_740x550.jpg
photos/83/15/88868/829344_740x550.jpg
photos/83/15/88868/829343_740x550.jpg
^
|
уникальный
|
|
|
Back to top |
|
 |
Flasher

Joined: 06 Nov 2009 Posts: 14229 Location: Москва
|
(Separately) Posted: Sun Aug 05, 2012 01:45 Post subject: |
|
|
Это не ответ на вопрос. Почему не 1, 2, 3? |
|
Back to top |
|
 |
astrolit
Joined: 26 Jul 2012 Posts: 42
|
(Separately) Posted: Sun Aug 05, 2012 13:37 Post subject: |
|
|
потому что надо оставить оригинальные названия ссылок, так как в последствие фото забираются с интернета |
|
Back to top |
|
 |
Flasher

Joined: 06 Nov 2009 Posts: 14229 Location: Москва
|
(Separately) Posted: Sun Aug 05, 2012 13:44 Post subject: |
|
|
Не понял, как это относится к моему вопросу.
Ответ должен выглядить примерно так:
Ограничить нужно до 4-х (не 2,3,5-ти) уникальных ссылок, потому что если будет меньше, то ..., а больше, то .... |
|
Back to top |
|
 |
astrolit
Joined: 26 Jul 2012 Posts: 42
|
(Separately) Posted: Sun Aug 05, 2012 13:51 Post subject: |
|
|
как я приблизительно вижу реализацию
если часть строчки (уникальный номер )похожа, тогда выделить похожие
вот тут вопрос как выделить первые четыре, далее уникальный номер подставляется следующий и опять проверяется условие и тут надо добавить результат к выделенному
после такого перебора должно быть выделено по четыре строчки от каждого уникального номера, но я не силён, в скриптовых командах выделения |
|
Back to top |
|
 |
Flasher

Joined: 06 Nov 2009 Posts: 14229 Location: Москва
|
(Separately) Posted: Sun Aug 05, 2012 14:01 Post subject: |
|
|
К сожалению, при таких ответах я ничем не могу помочь.. |
|
Back to top |
|
 |
astrolit
Joined: 26 Jul 2012 Posts: 42
|
(Separately) Posted: Sun Aug 05, 2012 14:05 Post subject: |
|
|
Ограничить нужно до 4-х (не 2,3,5-ти) уникальных ссылок, потому что если будет меньше, то - пусть остаётся меньше, а больше, то лишние удалить |
|
Back to top |
|
 |
|