Обсуждение:Программирование Викиданных/field of work (math)
Добавить темуРисунки и области математики
[править]@User:Elvira0p, рисунок получился интересный, спасибо! Но есть мелкие замечания:
- Неспецифичное, а потому неудачное название файла Table of fields.jpg
Можно пойти от описания (Сколько ученых заняты одновременно в двух областях математики) и предложить такое название: "Number of scholars sharing math fields". - В вики-разметке не нужно использовать символ br как в HTML. Нужно использовать пробельные строки как в Latex. Хотя я в специальных целях и использовал br строкой выше :)
- В названиях столбцов и строк лучше применять латиницу, а не кириллицу, на случай использования этой иллюстрации в английской версии статьи.
- В таблице на рисунке по диагонали можно было бы указать число учёных, занимающихся только этой областью.
- И всё-таки есть большое желание уместить (хотя бы для строк, не столбцов) названия областей на рисунке. Завтра на встрече поясню.
- Развёрнутая подпись для рисунков и таблиц - это обязательный элемент.
- Привычнее диагональная матрица другая. Нужно эту повернуть на 90 градусов против часовой стрелки.
- Предлагаю добавить ещё один столбце справа: сумма пересечений данной области со всеми прочими. Тогда будет видно, нужна ли ещё сортировка областей...
- На Викискладе принято писать описание на двух языках (родной и английский) и расставлять категории. -- Andrew Krizhanovsky (обсуждение) 08:55, 18 декабря 2016 (UTC)
Рейтинг ученых + гистограмма
[править]@User:Elvira0p, к этому разделу (а точнее, к подразделу " 1. Напишем SPARQL-запрос, который выводит список математиков и количество изучаемых ими наук") такое предложение. Постройте гистограмму учёных и числа наук (предметов, научных областей), которыми они занимаются. То есть вычислите и нарисуйте:
- число учёных с числом field_of_work == 0,
- число человек с одной наукой (одним интересом),
- число человек, занимающихся двумя науками,
- и так далее. Andrew Krizhanovsky (обсуждение) 19:02, 3 февраля 2017 (UTC)
Два рейтинга: один по всем математикам мира, второй по отечественным. -- Andrew Krizhanovsky (обсуждение) 19:25, 3 февраля 2017 (UTC)
@User:Elvira0p, получилось здорово! Две вещи.
0) Хорошая, ёмкая и понятная подпись к иллюстрации - это искусство. Попытайтесь добавить подписи ко всем иллюстрациям. См., например, страницу Работа в вики-среде (с упражнениями)/Энциклопедический стиль статей (идеалы и нейтральность). Примеры классных иллюстраций и развернутых подписей можно посмотреть в статьях журнала Nature. См. 6.5. Представление иллюстраций в тексте.
1) Можно попытаться сделать третий рисунок, в котором две гистограмы будут даны сразу. См. идеи от Гугла: comparative histograms. Возможно, будет лучше перейти на этом третьем рисунке к процентам. То есть писать, например, на рыжем рисунке не 424, а какой процент составляет 424 от общего числа отечественных учёных. Возможно, будет лучше видно, если шкала Y будет логарифмической.
2) После этих двух (или трёх) рисунков с гистограммами должно быть самое сложное и интересное - качественный анализ и сравнение гистограмм. Попробуйте ответить на вопросы:
- В чём сходство?
- В чём разница гистограмм?
- Почему так получилось (гипотезы)? -- Andrew Krizhanovsky (обсуждение) 20:48, 6 февраля 2017 (UTC)
О машиночитаемых данных (поиск по отношениям против поиска по текстовой строке "description")
[править]Эльвира, ещё вопрос. Мне казалось, что у Вас были скрипты, где Вы рассматривали учёных из СССР, России, Российской империи. А сейчас я вижу только "?item schema:description "Russian mathematician"@en". А где те скрипты? -- Andrew Krizhanovsky (обсуждение) 19:28, 3 февраля 2017 (UTC)
@User:Elvira0p, вот скрипт, который выбирает персон таких, что
- "country of citizenship" Россия или СССР или Российская империя,
- "occupation" (занятие) - mathematician (математик),
- description ≠ "Russian mathematician".
SELECT ?item ?label ?field_of_work ?field_of_workLabel
WHERE
{
?item wdt:P106 wd:Q170790. # occupation is 'mathematician'
?item wdt:P101 ?field_of_work . # field_of_work
{
{ ?item wdt:P27 wd:Q34266 } UNION # country of citizenship Russian Empire
{ ?item wdt:P27 wd:Q15180 } UNION # country of citizenship Soviet Union
{ ?item wdt:P27 wd:Q159 } # country of citizenship Russia
}
FILTER NOT EXISTS {
?item schema:description "Russian mathematician"@en. # 104 results
}
SERVICE wikibase:label { bd:serviceParam wikibase:language "en" }
?item rdfs:label ?label.
FILTER(LANG(?label) = "ru").
}
SPARQL query 104 Results
В этом списке из около 40 математиков мы редко видим неточную запись фразы "Russian mathematician". Например, Alexander Friedmann с двумя пробелами между словами "Russian" и "mathematician" вместо одного пробела. И в основном видим значимые персоны, описание которых заполнял не бот, а человек. Поэтому вместо шаблонного и казённого выражения "Russian mathematician" можно прочитать:
- "Russian mathematician and father of the first Earth space program" у Мстислава Всеволодовича Келдыша,
- "Russian mathematician and historian of mathematics (1900-1963)" у Василия Павловича Зубова, по-видимому и эта фраза мало отражает многогранность персоны,
- просто "Polymath" у Михаила Васильевича Ломоносова,
- "Game theorist" у Леона Аганесовича Петросяна,
- "Swiss-Russian astronomer and mathematician" у Иоганна Альбрехта Эйлера.
Разницу между страной и национальностью можно увидеть в следующих примерах российских или советских математиков:
- "Russian-born French mathematician and Fields Medallist" у Максима Концевича,
- "Finnish mathematician" у Ларса Альфорса,
- "Georgian mathematician" у Николая Ивановича Мусхелишвили.
По-видимому, с годами вдумчивая работа редакторов с карточками математиков на Викиданных будет вести к уменьшению числа шаблонных записей "Russian mathematician" (согласитесь, что невозможно при формулировке одного предложения, полно описывающего человека, получить одинаковый для всех математиков текст), и к увеличению самых разнообразных описаний.
Это указывает на ненадёжность и шаткость конструкций (скриптов), основанных на текстовых полях типа "schema:description". Поэтому при возможности уйти от текстовых полей с произвольным текстом к строго определённым отношениям, например, свойство country of citizenship или ethnic group, следует использовать эту возможность. -- Andrew Krizhanovsky (обсуждение) 15:32, 6 февраля 2017 (UTC)