Merhaba,
Anladığım kadarıyla projede, toplamda 30k-35k civarı bir verinin işlenerek 25k civarına indirgenmesi isteniyor. Yabancı isimlerin silinmesi yarı otomatik yarı manuel bir yöntem ile sağlanabilir. Benzer şekilde her satırda identical olarak ifade edebileceğimiz, yalnızca o satıra özel sayısal bir veri varsa duplicate verilerin temizlenmesi de otomatik bir şekilde yapılabilir.
Zor olan ve vakit alıcı gibi görünen kısım, kayıtlardan bazılarının ticaret sicil arama motorlarında aranması olacaktır. Bu işleme tabi tutulacak veri miktarı ne kadar? Ayrıca bu verilerin ayrı bir kısımda mı bulunduğu, yoksa diğer verilerin arasında rastgele mi dağıldığı çok büyük önem taşıyor.
Excel dosyalarını veya en azından örnek dosyalar atabilirseniz dosyaların karmaşıklığına göre geliştirilebilecek yöntemler, projenin süresi ve ücreti hakkında daha detaylı tartışabiliriz.
Saygılar.