Привет всем!
Давненько я не захаживал... .
Вопрос:
Помогите зимбабвийскому аборингену (мну) с парсингом тхт.
Проблема:
1. Есть файл - интернет страница сохранённая на диск.
2. В ней - миллиард ссылок (и больше).
3. Нужен алгоритм парсинга на наличие "http://.../".
4. Алго должен быть ОЧЕНЬ эффективеным и оптимизированым.
Я это и сам напишу за неделю .
Просьба за лень не пинать.
Меня интересует есть ли у кого ГОТОВЫЙ кусок кода.
За это скажу спасибо.
Я не от лени спрашиваю - так как если этот код писать самому прийдёться делать до 10 заходов но оптимизацию\тестирование.
Как минимум определить практически какой из алго работать будет лучше и быстрее ("окно", "регекспы" и т.п.). А задача-то стандартная.
Вот и спрашиваю может у кого-нить чёто завалялось.
Огромное спасибо заранее!