Introduktion
Mület med dette modelleringsprojekt var at forudsige resultatet af valget i 2024 ved hjÌlp af folkesundhedsdata, demografiske og historiske data. Den unikke tilgang er afhÌngig af forudsigelser, der er en proxy for offentlig støtte til det demokratiske parti i en befolkning. I USA stür vi over for et binÌrt valg, demokrat eller republikansk, og vores valg afgøres af valgmandsstemmer fra hver stat. Derfor var den forudsagte svarmüling simpelthen sejrsmarginen i en stat.
PĂĽ grund af valgkollegiet er forudsigelse af valget i bund og grund et spørgsmĂĽl om at forudsige en hĂĽndfuld stater. De fleste stater har en pĂĽlidelig historie med en bred sejrsmargin for den ene eller den anden part, mens nogle fĂĽ ikke har. Dataene og modellen vil vĂŚre nøjagtige i det omfang, de nøjagtigt forudsiger disse tilstande. PĂĽ grund af den mindre stikprøvestørrelse af de seneste nationale valg og vigtigheden af ââde seneste datapunkter i modellen, vil den ikke vĂŚre i stand til at producere meget prĂŚcise forudsigelser for stater med smĂĽ sejrsmargener. Derfor vil succesen af ââdenne model afhĂŚnge af dens evne til at opdage, hvilke svingstater der kan have mere støtte til demokrater (eller republikanere) end hvad der i øjeblikket bliver opdaget i meningsmĂĽlingerne.
Baggrund og antagelser
I løbet af de sidste to prĂŚsidentvalgscyklusser har vi set offentlige meningsmĂĽlinger slĂĽ fejl pĂĽ vĂŚsentlige mĂĽder. I 2016 formĂĽede nĂŚsten alle større meningsmĂĽlinger og medier ikke at opdage graden af ââoffentlig støtte blandt demokrater og uafhĂŚngige, der førte til Trumps sejr i vigtige swing-stater og RustbĂŚltet. I 2020 undervurderede valgstederne igen Trumps støtte i nøglestater. Siden da er tilliden til mediernes evne til at efterforske og komme frem til sandheden yderligere udhulet.
Denne analyse søger at finde forudsigelser, der afspejler en mere nøjagtig tilstand af offentlighedens politiske prÌferencer, som ikke er underlagt svaghederne ved meningsmülingsindustriens skÌvheder. Pü grund af den hyperpolariserede karakter af Covid-19-pandemien og de eksplicit klare linjer, hvor støtten til Covid-19-skuddet faldt, er offentlig optagelse for hvert ürs "nye" version af et Covid-19-skud stÌrkt korreleret med støtte til det demokratiske parti. Fordi der er et nyt Covid-19-skud hvert ür, antages fortsat optagelse at indikere demokratisk stemmetroskab. Andre indikatorer, süsom indenlandsk migrationsrate og anmodninger om brevstemme, er stÌrkt korreleret med demokratisk støtte gennem de sidste fire ür.
Derudover er befolkningsdata fra folkesundhedskilder blevet brugt som kontrollerende eller prĂŚdiktive variabler, herunder dødelighed, fødselsrate og mental sundhed. Nogle demografiske og befolkningsmĂŚssige dynamikker er forbundet med mere republikansk orienterede stater og andre med demokratisk orienterede stater, og disse forhold har holdt sig over tid i nyere historie. Andre foranstaltninger, som nettomigreringsrate, har stĂŚrke tilknytninger, men de er nyere og blev pĂĽvirket af Covid-19-pandemien, hvor mange lĂĽste blĂĽ stater oplevede et nettotab, og røde ĂĽbne stater oplevede en nettogevinst. Populariteten af ââdet nu ĂĽrlige Covid-19-skud aftager ĂĽr for ĂĽr, og dataene er blevet justeret for at mĂĽle relativ popularitet, hvor stater med en højere samlet optagelse end gennemsnittet afspejler højere demokratisk partistøtte.
Overordnet set søger denne analyse at kombinere büde langsigtede tendenser og nyere tendenser for at estimere det nuvÌrende niveau af støtte til Det Demokratiske Parti. Da modellen skal trÌnes pü data, der kun stilles til rüdighed i münederne (Covid-Vax) og ugerne (fravÌrende stemmeseddelanmodninger) op til valget, vil den ikke vÌre i stand til at registrere nogen 11. time-skift.
Som George Box sagde: "Alle modeller er forkerte, men nogle er nyttige." Mit hüb med denne analyse er, at det kan vÌre nyttigt at opdage signaler, som müske ikke er til stede i traditionel valgafstemning. Ud over forudsigelse (som mest er for sjov), har jeg inkluderet nogle swing state-analyser, som jeg tror kan kaste lys over nøgleskift, der er sket i løbet af de sidste fire ür.
Metoder
Fordi forklarlighed og fortolkning er kritisk i valgsammenhĂŚng, har jeg holdt mig til simple modeller. Generaliseret lineĂŚr modellering, logistisk regression og Random Forest-modeller blev alle trĂŚnet pĂĽ data fra 2020-2022. Resultatet, eller svaret, var marginen for det demokratiske partis sejr. For den logistiske model var det forudsagte svar en binĂŚr sejr eller et tab for den pĂĽgĂŚldende stat. Fordi hver model har sine egne styrker og svagheder sammen med sine egne fejlprocenter, vil den endelige klassificering af en sejr eller et tab blive bestemt af flertalsafstemningen. Jeg har uploadet min kode og data til github, og alle er velkomne til at kritisere, rette eller give feedback.
BegrĂŚnsninger
PĂĽ grund af min beslutning om at bruge Covid-19-skudoptagelse blandt stater som en forudsigelse, begrĂŚnser dette tidslinjen og data, der kan indsamles. PĂĽ grund af dette forventer jeg, at modellen vil have en bias over for demokraterne. Ud af 50 stater faldt fem inden for rĂŚkkevidden af ââfejl. Alle fem af disse stater betragtes som svingstater. Til kategoriseringsformĂĽl vil kun stater, der falder klart uden for fejlene i mine modeller, blive kategoriseret som en gevinst for den pĂĽgĂŚldende part. Dem inden for fejlintervallerne vil blive kategoriseret som toss-ups.
Diskussion
Fordi i USA er valg et binÌrt valg, ser analysen kun pü demokrat vs. republikaner og kan ikke registrere Ìndringer i støtten til en kandidat blandt vÌlgere fra det modsatte parti. Dette afslører en kerneantagelse i modellen, at dette valg stadig primÌrt handler om partitroskab over for den enkelte kandidat.
For den demokratiske kandidat Kamala Harris tror jeg, at denne antagelse holder stik, da hun ikke blev valgt via folkeafstemning under primÌrvalget, og meget af kampagnen har handlet om at skabe en strategisk udformet persona ud af en kvinde, der indtil for nylig stort set var blevet ignoreret , afvist og endda hünet. Vi kan se, at debatterne, mordforsøgene og andre store øjeblikke i løbet af de sidste par müneder simpelthen ikke har haft nogen større effekt pü meningsmülingstendenserne.
For Donald Trump tror jeg ikke, at denne antagelse holder. Trumps velkendte persona er dominerende og allestedsnÌrvÌrende. Fra hans prÌsidentperiode fra 2017-2021 og hans fortsatte kampe med retssager, mordforsøg og mediebesÌttelse siger Trumps sejr meget mere om ham end det republikanske parti. Det Demokratiske Parti er en maskine, og det republikanske parti styrkede kun modvilligt støtten til Trump efter flere ürs konflikt og splittelse blandt dets ledere.
Da modellen bruger data fra bĂĽde prĂŚsidentvalget i 2020 og Senatsvalget i 2022, er den trĂŚnet til at modellere partistøtte, og dermed dens iboende svaghed. Den seneste meningsmĂĽling har skiftet i Trumps favør, men har store svingstater i dødt løb. For at holde fast i mine metoder og hensigten med denne øvelse, er ingen af ââdisse data inkluderet.
Swing State Analyse
Valgets resultat vil blive bestemt af en hündfuld stater. I øjeblikket er de tÌtte løb i Arizona, Nevada, Wisconsin, Michigan, North Carolina, Georgia og Pennsylvania nok til at svinge valget til begges fordel. Af disse stater kategoriserede modellen Michigan og Pennsylvania som sikkert svingende demokratiske. De resterende tilstande var alle inden for modellens fejlomrüde og blev derfor kategoriseret som toss-ups.
For at give en vis visuel kontekst for, hvordan denne analyse fungerer, er her et par opdelinger af nogle af prĂŚdiktorerne for de stater, der generelt betragtes som svingtilstande.
Indenlandske migrationsrater: 2019-2023*
Samlet set er der et negativt forhold mellem nettomigrationsraten og den demokratiske sejrsmargin. I løbet af de sidste 4 ür har mange blü stater mistet mennesker, mens røde stater har vundet. For disse svingstater er nogle "røde" med hensyn til guvernører og statsregering, og andre er "blü". Samlet set er Pennsylvania og Michigan de eneste 2, der har haft negative migrationsrater i løbet af de sidste 4 ür.
Indsendt stemmeseddel
Nogle stater, som Californien, Colorado og Nevada, er "All Mail"-stater. Det betyder, at alle registrerede vĂŚlgere som standard fĂĽr tilsendt en papirstemmeseddel. Med undtagelse af Utah (og muligvis Nevada) er nĂŚsten alle disse stater blĂĽ stater og solidt blĂĽ. Nevada er den eneste swing-stat, der er en all-mail-stat, som du kan se, at dens anmodninger forbliver flad. Den generelle tendens med de fleste andre undtagen Arizona er et fald i post-i-afstemningsanmodninger.
Ă rlig Covid-19 skudoptagelse**
Da modellen bruger ürlig Covid-shot-optagelse som en stÌrk forudsigelse af det demokratiske partis støtte, men den generelle popularitet er faldende, bruger modellen relativ scoring til at sammenligne hver stat med hinanden inden for üret. Bortset fra Wisconsin havde de resterende stater en Covid-19-skudoptagelse lidt under gennemsnittet i 2021**, 2022 og 2024.
*Den indenlandske migrationsrater er matchet fra det foregĂĽende ĂĽr.
**Fordi Covid-19-billederne ikke var tilgÌngelige før 2021, blev 2021-data parret med 2020-valgresultatdata. For 2022 og 2024 afspejler data optagelsen for det ürs nye version.
For at fĂĽ en fornemmelse af, hvor vigtige prĂŚdiktorerne er for modellen, rangerer nedenstĂĽende diagram hvert mĂĽl for, hvor meget det pĂĽvirker en af ââmodellens forudsigelser. Som du kan se, er Covid-19-skudoptagelsen placeret lige under "tidligere demokratisk sejr."
Resultater
Modellen har fĂĽet Harris til at vinde sikkert 260 valgmandsstemmer fra de stater, som den forudser vil vĂŚre sikkert demokratiske. Hvis Pennsylvania og Michigan faktisk er i strid, sĂĽ er kun 226 af dem sikkert demokratiske.
Modellen har fĂĽet Trump til at vinde sikkert 219 valgmandsstemmer fra de stater, som den forudser vil vĂŚre sikkert republikanske.
Swing-staterne Wisconsin, Georgia, North Carolina, Nevada og Arizona er alle pü spil og reprÌsenterer 59 valgmandsstemmer. Hvis Pennsylvania og Michigan er i blandingen, er det 93 valgmandsstemmer pü højkant.
Harris's vej til at vinde
Harris' vej til sejr ser nemmest ud. Med en højere startende valgmandsstemme "i posen" kan hun samle en hĂĽndfuld svingstater. Pennsylvania og Michigan viser sig som sejre for hende i modellen, og hvis hun vinder dem, har hun simpelthen brug for en enkelt af Arizona, North Carolina, Wisconsin eller Georgia for at lĂĽse den ned. Hvis hun vinder den ene eller den anden af ââPennsylvania eller Michigan, skal hun erstatte tabet med 1-2 ekstra svingstater.
Trumps vej til sejr
Det er vigtigt at se pü Trumps vej med en "alt kan ske" tankegang. Han har overgüet forventningerne ved begge forudgüende valg. De fleste informations-gatekeepere, mainstream-eksperter og valgundersøgelseseksperter har taget fejl i fortiden.
Med 219 i bagagen mĂĽ Trump tage hver eneste slyngestat Arizona, Georgia, North Carolina, Wisconsin og Nevada. Hvis Trump vinder Pennsylvania og/eller Michigan, sĂĽ bliver hans vej nemmere, hvilket betyder, at han stadig skal bruge 2-3 af de resterende tos-ups.
Tag et kig pĂĽ Dashboardet nedenfor. Interager for at se, hvordan begge kandidaters vej til sejr ved at vinde toss-up-staterne, og se scatterplots for forudsigelser mĂĽlt efter stat.
Mine personlige forudsigelser baseret pĂĽ modellen
Jeg har mere en intuition om North Carolina og Georgia, da jeg tilbringer tid der, og jeg kalder dem for Trump. Jeg har ikke den intuition for Arizona, Nevada eller Wisconsin. SĂĽ tag dette med et gran salt. Men da jeg er tro mod metoden, kalder min model Pennsylvania og Michigan for Harris, og jeg tror, ââhun vil tage mindst 2-3 ekstra swing-stater. Jeg hĂĽber, jeg tager fejl.
Referencer:
MIT valglaboratorium https://electionlab.mit.edu/data#data
USA Fakta https://usafacts.org/economy/
UF Valglab https://election.lab.ufl.edu/voter-turnout/
Afstemning og registrering ved valget i november 2022 https://www.census.gov/data/tables/time-series/demo/voting-and-registration/p20-586.html
CDC https://data.cdc.gov/NCHS/Indicators-of-Anxiety-or-Depression-Based-on-Repor/8pt5-q6wp/about_data
CMS https://data.cms.gov/provider-data/dataset/avax-cv19
CDC https://www.cdc.gov/covidvaxview/weekly-dashboard/vaccine-administration-coverage-jurisdiction.html
Fem tredive otte https://github.com/fivethirtyeight/election-results/blob/main/election_results_senate.csv
KFF Vaccinemonitor https://www.kff.org/coronavirus-covid-19/dashboard/kff-covid-19-vaccine-monitor-dashboard/
UF Valglab https://election.lab.ufl.edu/2024-presidential-nomination-contests-turnout-rates/
National Center for Sundhedsstatistik https://www.cdc.gov/nchs/data_access/VitalStatsOnline.htm CDC https://www.cdc.gov/nchs/data/vsrr/vsrr035.pdf Census.Gov https://www.census.gov/data/tables/time-series/demo/popest/2020s-state-total.htmlCDC https://www.cdc.gov/covidvaxview/interactive/adults.html
National Center for Sundhedsstatistik https://www.cdc.gov/nchs/fastats/state-and-territorial-data.htm
FolketĂŚlling- Fattigdom https://www.census.gov/data/tables/time-series/demo/income-poverty/historical-poverty-people.html
FolketĂŚlling- BefolkningsĂŚndring efter stat https://www.census.gov/newsroom/press-kits/2023/national-state-population-estimates.html
USAs valgprojekt https://electproject.github.io/
Genudgivet fra forfatterens understak
Udgivet under a Creative Commons Attribution 4.0 International licens
For genoptryk, sĂŚt venligst det kanoniske link tilbage til originalen Brownstone Institute Artikel og forfatter.