Motivação!
A motivação para essa aplicação surgiu após ver o tema do dia 09/01/2024 do
TidyTuesday!
Basicamente, se trata de fazer uma análise de um data base para responder a seguinte pergunda:
“As datas de nascimento ainda são um destino para os jogadores canadenses da NHL?”, tema bastante discutido no link!
Os dados foram coletados do
Statistics Canada, NHL team list endpoint e NHL API
Análise
Para ter uma ideia do banco de dados:
| player_id |
first_name |
last_name |
birth_date |
birth_city |
birth_country |
birth_state_province |
birth_year |
birth_month |
| 8462176 |
Brent |
Sopel |
1977-01-07 |
Calgary |
CAN |
Alberta |
1977 |
1 |
| 8462032 |
Bryan |
Berard |
1977-03-05 |
Woonsocket |
USA |
Rhode Island |
1977 |
3 |
| 8448959 |
Donald |
MacIver |
1955-05-03 |
Montréal |
CAN |
Quebec |
1955 |
5 |
| 8467834 |
Gregg |
Naumenko |
1977-03-30 |
Chicago |
USA |
Illinois |
1977 |
3 |
| 8446699 |
Glen |
Harmon |
1921-01-02 |
Holland |
CAN |
Manitoba |
1921 |
1 |
| 8445512 |
Charlie |
Conacher |
1909-12-20 |
Toronto |
CAN |
Ontario |
1909 |
12 |
| 8445334 |
Gene |
Carrigan |
1907-07-05 |
Edmonton |
CAN |
Alberta |
1907 |
7 |
| 8466436 |
Martin |
Sonnenberg |
1978-01-23 |
Wetaskiwin |
CAN |
Alberta |
1978 |
1 |
| 8447997 |
Gordie |
Nelson |
1947-05-10 |
Kinistino |
CAN |
Saskatchewan |
1947 |
5 |
| 8451513 |
Derek |
Smith |
1954-07-31 |
Quebec City |
CAN |
Quebec |
1954 |
7 |
A análise que irá ser feita, usará apenas a coluna birth_month que representa o mês de nascimento do jogador!
| birth_month |
Freq |
| Jan |
876 |
| Fev |
819 |
| Mar |
834 |
| Abr |
796 |
| Mai |
783 |
| Jun |
692 |
| Jul |
696 |
| Ago |
602 |
| Set |
639 |
| Out |
620 |
| Nov |
561 |
| Dez |
556 |
Como queremos transformar esses dados em formato de matriz para aplicar técnicas da Álgebra Linear vamos entender esse data base como uma matriz:
⎝⎛x123456789101112y876819834796783692696602639620561556⎠⎞=A=⎝⎛111111111111123456789101112⎠⎞,B=⎝⎛876819834796783692696602639620561556⎠⎞
Conforme visto em
Ortogonalidade e Mínimos quadráticos:
Vamos usar a foˊrmula: projcolAb=(AtA)x=Atb
AtA=(111213141516171819110111112)⎝⎛111111111111123456789101112⎠⎞=(127878650)
Temos ainda que:
Atb=(111213141516171819110111112)⎝⎛876819834796783692696602639620561556⎠⎞=(847450749)
Agora escalonamos a matriz:
(781265078507498474)=(0110−30.29903.07)
Logo temos a nossa reta y = -30.29x + 903.07
- Posted on:
- February 2, 2024
- Length:
- 3 minute read, 636 words
- Categories:
- Álgebra Linear R Latec
- See Also: