С использованием средств бибилиотеки NetworkX получить навыки в исследовании вероятностных свойств web-графа.
Шаг 1. (данные) Используя данные открытой библиотеки SNAP (Stanford Network Analysis Platform), изучите и сохраните информацию о web-графах Enron и Twitter. В помощь networkx+python.
Шаг 2. (анализ) С помощью бибилиотеки NetworkX проведите анализ для обоих графов по аналогии с Практикум 1:
# | Анализ web-графа |
---|---|
1 | Выведите информацию о графе с помощью метода nx.info() |
2 | Для произвольной вершины выведите a) степень вершины, b) список соседних вершин |
3 | Для двух произвольных вершин найдите кратчайшее расстояние и выведите кратчайший путь. |
4 | Найдите диаметр графа. В помощь Diameter_enron.html (ipynb) |
5 | Постройте распределение степеней вершин графа, найдите среднюю степень вершины. Убедитесь, что распределение степеней вершин подчиняется степенному закону. Для этого постройте уравнение степенной регрессии, с помощью критерия Фишера проверьте статистическую надежность регрессии. |
6 | Сравните результаты для графов Enron (небольшой, неориентированный) и Twitter (большой, ориентированный). |
Шаг 3. (гигантская компонента) Для каждого графа Enron и Twitter выделите гигантскую компоненту и сохраните как подграф. Убедитесь, что подграф является связным. С помощью nx.center получите центральные узлы подграфа.