Наборы данных для реалистичной генерации случайных / тестовых данных [закрыто]

где получить наборы данных для генерации случайных или тестовых данных, таких как имена/фамилии с распределением, адресные данные, названия университетов/школ, названия компаний и т. д.?

Я нашел список английских имен и фамилий, с их количеством (К сожалению, я не заметил, откуда я это взял). Я получил адресную базу данных из Польши. Однако эти наборы данных из других стран также были бы очень полезны для меня. То же самое с названиями университетов и школ.

какие данные нужен ли вам в качестве источника такой информации? Можете ли вы предоставить ссылки на такие данные? (конечно, только те, кто свободен в открытом доступе)

5 ответов


Я думаю, вы найдете ответ на свой вопрос по следующим темам:

образец базы данных для упражнений

https://stackoverflow.com/questions/202092/where-can-i-find-free-and-open-data


в интернете есть много генераторов данных с открытым исходным кодом и коммерческих тестов. Ниже 2 хорошие

  1. http://www.sqledit.com/dg/
  2. http://www.generatedata.com/#about
  3. для случайных чисел/строк: http://www.random.org/

Amazon сделала несколько общедоступных наборов данных доступными для бесплатной загрузки: http://aws.amazon.com/publicdatasets/


попробуйте http://www.mockaroo.com

вы можете генерировать до 100 000 строк данных в форматах CSV, tab-delimited и SQL, сохранять и повторно использовать схемы и автоматизировать генерацию тестовых данных с помощью curl.


есть бесплатный API в http://randomprofile.com/api-for-developers/ для генерации профилей потребителя теста которые включают имя, фамилию, адрес, данные по Банка, номер КК, тип крови ЕТК. Не уверен в школах, но полезно, если вы ищете данные о азиатских пользователях.