Autorka
mgr Aleksandra Tomaszewska realizuje projekt Brukselizmy. Jest językoznawczynią i tłumaczką, absolwentką lingwistyki stosowanej w Instytucie Lingwistyki Stosowanej Uniwersytetu Warszawskiego. Studiowała również w ramach stypendium Erasmus+ w Paryżu w Institut national des langues et civilisations orientales należącym do Université Sorbonne Paris Cité. Jej zainteresowania naukowe obejmują przede wszystkim językoznawstwo korpusowe, narzędzia i zasoby korpusowe, językoznawstwo komputerowe, językoznawstwo kontaktu i analizę dyskursu (również instytucjonalnego). W latach 2018–2023 prowadząca na kierunkach lingwistyka stosowana (tłumaczenia UE/prawo i społeczno-polityczne) oraz Język i Społeczeństwo (badania korpusowe). Od 10.2017 doktorantka na Uniwersytecie Warszawskim. Uczestniczka konferencji naukowych (np. ICCS; LREC-COLING; Manchester Forum in Linguistics) i wydarzeń popularyzatorskich (np. Festiwal Nauki na UW; warsztaty CLARIN-PL); autorka i współautorka publikacji naukowych. Współtworzy i doskonali zasoby dla języka polskiego oraz narzędzia korpusowe w ramach projektów badawczych DARIAH, CLARIN, COST czy PLLuM. Współpracuje z Instytutem Podstaw Informatyki Polskiej Akademii Nauk i Katedrą Sztucznej Inteligencji Politechniki Wrocławskiej. Absolwentka szkoleń z zakresu analizy danych i językoznawstwa korpusowego, np. na Uniwersytecie w Birmingham, Uniwersytecie w Lancasterze, Uniwersytecie Jagiellońskim, Uniwersytecie w Utrechcie i Uniwersytecie Warszawskim.
Kontakt: a.tomaszewska2@uw.edu.pl
Rozdziały w monografiach, artykuły naukowe, zasoby:
- Tomaszewska, A., & Jamka, A. (przyjęte, w druku, rozdział w monografii zaplanowany na przełom 2024/2025). Emotions and Institutional Approaches to Gender-Fair and Gender-Neutral Language in Europe: A Comparative Study of Poland, Spain, and the UK. W: G. L. Schiewer & J. Szczepaniak (Red.), Unveiling Emotions in Discourse Across Media and Natural Encounters. Wiesbaden: Harrasowitz.
- Tomaszewska, A., & Ogrodniczuk, M. (przyjęte, w druku, planowana publikacja we wrześniu 2024). Corpus Studies in 2024: Emerging Trends and Applications. W International Congress of Linguists. Leiden: Brill.
- Tomaszewska, A., Silvano, P., Leal, A., & Amorim, E. (2024). ISO 24617-8 Applied: Insights from Multilingual Discourse Relations Annotation in English, Polish, and Portuguese. In Proceedings of the 20th Joint ACL – ISO Workshop on Interoperable Semantic Annotation @ LREC-COLING 2024 (pp. 99–110). ELRA and ICCL, https://aclanthology.org/2024.isa-1.13/.
- Marciniak, M., Kieraś, W., Bojałkowska, P., Borkowski, P., Borys, M., Eźlakowski, W., Guz, W., Kobyliński, Ł., Komosińska, D., Krasnowska-Kieraś, K., et al. (2024). Korpus Współczesnego Języka Polskiego, https://kwjp.ipipan.waw.pl/query_corpus/21/.
- Ogrodniczuk, M., Tomaszewska, A., Ziembicki, D., Żurowski, S., Tuora, R., & Zwierzchowska, A. (2024). Polish Discourse Corpus (PDC): Corpus design, ISO-compliant annotation, data highlights, and parser development. In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024) (pp. 12829–12835). Torino, Italia: ELRA and ICCL, https://aclanthology.org/2024.lrec-main.1123/.
- Tomaszewska, A., & Jamka, A. (2024). Język wrażliwy na płeć w sejmie i senacie: badanie korpusowe strategii feminizacji i neutralizacji w polskim dyskursie parlamentarnym. Język Polski, https://doi.org/10.31286/JP.00995.
- Kazienko, P., Piasecki, M., Okulska, I., Janz, A., Kocoń, J., Ogrodniczuk, M., Karlińska, A., Tomaszewska, A., Oleksy, M., Wieczorek, J., Roszko, R., Dadas, S., Kozłowski, M., Wiśnios, E., Pezik, P. M., & Rybak, P. (2024). PLLuM: Towards Polish Large Language Model. PP RAI 2024.
- Tomaszewska, A., & Jamka, A. (2023). Język wrażliwy na płeć (gender-fair language) w debatach parlamentarnych w korpusie ParlaMint – badanie pilotażowe. W Analiza danych parlamentarnych: warsztat pokonkursowy, https://ipipan.waw.pl/pliki/wydawnictwo/Analiza-danych-parlamentarnych.pdf, s. 35–41.
- Saputa, K., Tomaszewska, A., Zawadzka-Paluektau, N., Kieraś, W., & Kobyliński, Ł. (2023). Korpusomat.eu: A multilingual platform for building and analysing linguistic corpora. In J. Mikyška, C. de Mulatier, M. Paszynski, V. V. Krzhizhanovskaya, J. J. Dongarra, & P. M. A. Sloot (Eds.), Computational Science – ICCS 2023. 23rd International Conference, Prague, Czech Republic, July 3–5, 2023, Proceedings, Part II (Lecture Notes in Computer Science, Vol. 14074, pp. 230–237). Cham: Springer Nature Switzerland, https://nlp.ipipan.waw.pl/Bib/sap:etal:23:iccs.pdf.
- Zawadzka-Paluektau, N., Tomaszewska, A., & Wołoszyn, J. (2023). Po Narodowym Korpusie Języka Polskiego – zmiany w słownictwie polskim ostatniej dekady na przykładzie słów kluczowych. Poradnik Językowy. DOI: 10.33896/PorJ.2023.4.2., s. 28–45.
- Żurowski, S., Ziembicki, D., Tomaszewska, A., Ogrodniczuk, M., & Drozd, A. (2023). Adopting ISO 24617-8 for Discourse Relations Annotation in Polish: Challenges and Future Directions. W Language, Data and Knowledge Conference (LDK 2023) Proceedings, Association for Computational Linguistics (ACL).
- Tomaszewska, A. (2021). Language and the European Union: Looking for Brusselisms in Polish. Neofilologia: Perspektywy Transdyscyplinarności.
- Tomaszewska, A., & Zawadzka-Paluektau, N. (2021). Translating a pandemic: A corpus study of COVID-19 multi-word terminology in EU press releases. Beyond Philology An International Journal of Linguistics, Literary Studies and English Language Teaching, 2021. DOI: 10.26881/bp.2020.4.01, https://czasopisma.bg.ug.edu.pl/index.php/beyond/article/view/6142/5395.
- Tomaszewska, A. (2016). Influence of Eurojargon on Polish MEPs’ Discourse. Społeczeństwo. Edukacja. Język, https://cejsh.icm.edu.pl/cejsh/element/bwmeta1.element.desklight-148b3d2d-6e74-45df-b1bc-80fd802061d7/c/art19.pdf.
Referaty wygłoszone na konferencjach naukowych:
- Tomaszewska, A., Silvano, P., Leal, A., & Amorim, E. (2024). ISO 24617-8 Applied: Insights from Multilingual Discourse Relations Annotation in English, Polish, and Portuguese. Wystąpienie na 20th Joint ACL – ISO Workshop on Interoperable Semantic Annotation @ LREC-COLING 2024, Turyn, Włochy, ELRA i ICCL.
- Ogrodniczuk, M., Tomaszewska, A., Ziembicki, D., Żurowski, S., Tuora, R., & Zwierzchowska, A. (2024). Polish Discourse Corpus (PDC): Corpus design, ISO-compliant annotation, data highlights, and parser development. Wystąpienie na 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), Turyn, Włochy, ELRA i ICCL.
- Tomaszewska, A. (2024). Multilingual Discourse Annotation Initiative (MDAI): Objectives, Challenges, and Possibilities. 6th NexusLinguarum Plenary Meeting – Final Event Conference. Marzec 2024.
- Kazienko, P., Piasecki, M., Okulska, I., Janz, A., Kocoń, J., Ogrodniczuk, M., Tomaszewska, A., Karlińska, A., Oleksy, M., Wieczorek, J., et al. (2024). PLLuM: Towards Polish Large Language Model. PP-RAI 2024.
- Tomaszewska, A. i Jamka, A. (2023). Język wrażliwy na płeć (gender-fair language) w polskim parlamencie: badanie korpusowe debat parlamentarnych w korpusie ParlaMint. Analiza danych parlamentarnych – warsztaty. Sejm RP.
- Tomaszewska, A. (2023). Contact-Induced Linguistic Change in European Union Polish: A Corpus Study of Legal, Institutional and Political Discourse; Linguistischer Nachwuchsworkshop (LiNaWo), 12–15.10.2023, Uniwersytet Warszawski i Universität des Saarlandes.
- Żurowski, S., Ziembicki, D., Tomaszewska, A., Ogrodniczuk, M., Drozd, A. (2023). Adopting ISO 24617-8 for Discourse Relations Annotation in Polish: Challenges and Future Directions. DiSLiDas. Language Data Knowledge (LDK). 09.2023, Wiedeń, Austria.
- Saputa, K., Tomaszewska, A., Zawadzka-Paluektau, N., Kieraś, W., Kobyliński, Ł. (2023). Paper entitled Korpusomat.eu: A Multilingual Platform for Building and Analysing Linguistic Corpora. International Conference on Computer Science (ICCS) 2023, 07.2023, Praga, Czechy.
- Zawadzka-Paluektau, N., Tomaszewska, A. i Wołoszyn, J. (2022). Po Narodowym Korpusie Języka Polskiego — zmiany w słownictwie polskim ostatniej dekady na przykładzie słów kluczowych, konferencja Słowa-klucze, Uniwersytet Warszawski, 12.2022.
- Tomaszewska, A., EU Borrowings in EU Law, Press Releases, and Interviews with MEPs: Selected Trends from the Study of Their Distribution, Adaptation, and Functions in Polish, Philotrans colloquium, 4EU+, Uniwersytet Karola w Pradze, 06.2022.
- Tomaszewska, A., Distribution, Assimilation and Functions of EU Borrowings – A Review of the Trends in Polish-Language Corpora, II Interdyscyplinarna Konferencja SDNH UW, 01.2022.
- Tomaszewska, A. EU Borrowings in Media and Law – Distribution Analysis, Konferencja Jubileuszowa TMJP, Uniwersytet Jagielloński, IJP PAN i Uniwersytet Pedagogiczny w Krakowie, 05.2021.
- Tomaszewska, A., Zawadzka-Paluektau, N., COVID-19 Pandemic and Terminology in EU Translation, Konferencja Pandemia w Języku Prawa, Uniwersytet Warszawski, 05.2021.
- Tomaszewska, A., Zawadzka-Paluektau, N., 2021, Internationalisation of COVID-19 neologisms: A multilingual corpus study. The Manchester Forum in Linguistics (mFiL), Manchester, Wielka Brytania, Uniwersytet w Manchesterze.
- Tomaszewska, A., Zawadzka-Paluektau, N. 12th International Conference on Corpus Linguistics (CILC2021), Hiszpania, Murcja, The Spanish Association of Corpus Linguistics (AELINCO), Universidad de Murcia, paper entitled Wu flu, virus couronné, Chinese virus: A multilingual corpus study of COVID-19 neologisms, 2021.
- Tomaszewska, A., I Interdyscyplinarna Konferencja SDNH, The Influence of EU Discourse on Polish: A Corpus-Based Genre Analysis of EU Borrowings, 2020.
- Tomaszewska, A., Seminarium NLP, Polska Akademia Nauk, Instytut Podstaw Informatyki, Multi-Genre Analysis of EU Borrowings in Polish – the Need for Automation, 2019,
- Tomaszewska, A., Poznań Linguistic Meeting 2019, UAM Poznań, EU Borrowings in the Polish Language: A Cross-Genre Classification, 2019.
- Tomaszewska, A., Various Dimensions of Contrastive Studies (VDOCS), Ustroń, Uniwersytet Śląski, How the European Union Influences Polish: EU Borrowings in Interviews, Press Releases, and Law, 2019.
- Tomaszewska, A., TRANSLATON 1: Contemporary Paradigms of Translational Research. Chances and Challenges, Uniwersytet Wrocławski, Modernity and Language Contacts in Polish – A Corpus-Based Analysis of EU Borrowings, 2018.
- Tomaszewska, A., Imago Mundi: Translation Yesterday, Today and Tomorrow, ILS UW, EU Borrowings in Polish, 2018.
- Tomaszewska, A., Kontakty językowe – historia i współczesność. LXXVI Kongres Polskiego Towarzystwa Językoznawczego, Uniwersytet Gdański, Contemporary Language Contacts: EU Borrowings in Polish, 2018.
- Tomaszewska, A., Perspektywy Transdyscyplinarności, Uniwersytet Warszawski, The Influence of the European Union on Today’s Polish: The EU Borrowings Project, 2018.
- Tomaszewska, A., Kolokwium Zakładu Badań nad Dyskursem, ILS UW, Corpus Analysis as a Tool for Discourse Analysis on the Example of the Study of EU Borrowings, 2018.
- Tomaszewska, A., Mobility And Inclusion In Multilingual Europe: Language Policy Design, Analysis and Evaluation, Zagrzeb, Chorwacja, The Impact of EU Multilingualism on National Languages: the Case of ‘Brusselisms’ in Polish, 2017.
- Tomaszewska, A., Quo Vadis Lingua, ILS UW, Subsidiarity, leadership and personal composition – or how Eurojargon influences the discourse of Polish Members of the European Parliament, 2016.
Współprace międzynarodowe
- Założyła grupę badawczą Multilingual Discourse Annotation Initiative (MDAI) zrzeszającą zespoły z Polski, Portugalii i Niemiec.
- W ramach Short-Term Scientific Mission odbyła dwutygodniowy staż na Uniwersytecie w Porto (październik 2022) pod kierunkiem prof. P. Silvano.
- Realizowała projekty badawcze COST Multilingual Discourse Annotation Initiative (MDAI): A Polish-Portuguese Cooperation in Discourse Relations Annotation Following ISO 24617-8:2016 w ramach minigrantu Virtual Mobility Grant, 2023 oraz, w ramach minigrantu STSM COST, projekt Towards ‘Universal Discourse’: The Project of a Multilingual Discourse Description (2022).
- Aktywna członkini akcji COST. W 2024 r. pełniła funkcję członkini komitetu zarządzającego (Management Committee Member) akcji COST ENEOLI z ramienia Polski – w funkcji substitute, do czerwca 2024. Członkini grup roboczych WG1, WG2 i WG3. Uczestniczka podgrup projektowych. https://www.cost.eu/actions/CA22126/#tabs+Name:Working%20Groups%20and%20Membership.
- Członkini akcji COST NexusLinguarum, grupy robocze 1 i 3 – do zakończenia akcji w 2024 roku.
Działalność popularyzatorska
Poniżej podano kilkanaście przykładów takich działań, w tym siedem bezpośrednio związanych z projektem “Brukselizmy”.
- Tomaszewska, A. i Ziembicki, D., (2023). Wykład “Natural Language Processing: Computer Methods in Language Analysis”, Inauguracja grupy roboczej EUR-Identity w ramach MSCA Action Grant, Wydział Neofilologii, Uniwersytet Warszawski.
- Kobyliński, Ł., Kieraś, W., Saputa, K., Tomaszewska, A., Koselski, F., Penno, S. (2023). Korpusomat.eu – tworzenie korpusów nie tylko w języku polskim. Warsztaty CLARIN-PL w praktyce badawczej. Konsorcjum CLARIN/Instytut Podstaw Informatyki PAN, Warszawa, 11.05.2023. Wykład z prezentacją wyników projektu na temat brukselizmów i metodologii badań w tym projekcie.
- Kobyliński, Ł., Kieraś, W., Saputa, K., Tomaszewska, A., Koselski, F., Penno, S. (2023). Korpusomat.eu – warsztaty praktyczne. Warsztaty CLARIN-PL w praktyce badawczej. CLARIN/Instytut Podstaw Informatyki PAN, Warszawa, 11.05.2023. Warsztaty z case studies na temat brukselizmów.
- Kobyliński, Ł., Kieraś, W., Saputa, K., Tomaszewska, A., Zawadzka-Paluektau, N., Koselski, F., Penno, S. (2022). Korpusomat, wystąpienie na warsztatach CLARIN, 12.2022. Warsztaty z wprowadzeniem i case studies na temat identyfikacji i analizy brukselizmów.
- Tomaszewska, A., Konkurs Ma thèse en 180 secondes Pologne, 2022. L’influence du discours de l’Union européenne sur le polonais : les bruxellismes dans le droit communautaire, les communiqués de presse et les entretiens avec les députés européens.
- Tomaszewska, A., Dni Nauki, Zielonka, 2019. Kontakty językowe. Zapożyczenia dawniej i dziś – z przykładami brukselizmów.
- Tomaszewska, A., XXIII Festiwal Nauki, Uniwersytet Warszawski, warsztaty na temat kontaktów językowych i brukselizmów, 2019.
- Tomaszewska, A., & Jamka, A., XXIII Festiwal Nauki, Uniwersytet Warszawski, wykład na temat tłumaczenia języka inkluzywnego w instytucjach UE.
- Tomaszewska, A., XXII Festiwal Nauki, Uniwersytet Warszawski, warsztat na temat brukselizmów w języku polskim, 2018.
- Wystąpienie w podkaście Stacja IT. Projekt PLLuM, czyli AI po polsku. Aleksandra Tomaszewska, Piotr Rybak (2024). Youtube/Spotify. https://www.youtube.com/watch?v=VjD6f4LoEws.
- Tomaszewska, A. (2024). “Pozyskiwanie w PLLuM”. Artykuł. https://pllum.org.pl/blog/posts/pozyskiwanie-w-pllum.
- Tomaszewska, A. (2024). “Czym karmimy PLLuM-a”. Artykuł. https://pllum.org.pl/blog/posts/czym-karmimy-plluma.
- Tomaszewska, A. (2024). “Korpusy w AI w 2024 roku – w kierunku danych lepszej jakości”. Artykuł do hAI, czasopisma o sztucznej inteligencji. https://haimagazine.com/pl/produkt/hai-magazine-1-2024-2/.
Organizacja, szkolenia i nagrody
Aleksandra Tomaszewska brała również udział w organizacji konferencji naukowych związanych tematycznie z realizacją projektu jako członkini komitetu konferencyjnego lub jako asystentka komitetu, np. Translating Europe Workshop (dwukrotnie); Forum on Quality in Legal Translation; szkolenia, np. Legal English: Lingua Franca and Translation in EU Competition Law. Swoje kompetencje rozwijała na szkoleniach, szczególnie metodologicznych, np. dwie edycje Summer School of Corpus Linguistics, Uniwersytet w Birmingham, Wielka Brytania, 2021 i 2017 r.; kursy w Lancasterze, np. statystyka i wizualizacja danych, Corpus Linguistics School, Uniwersytet w Lancaster, 20–24.06.2022 r.; Corpus Linguistics: Lingwistyka korpusowa: Metoda, analiza, interpretacja, Uniwersytet w Lancaster, 2017; Letnia Szkoła Analizy Danych i Metod Jakościowych, Analiza treści (jakościowa i ilościowa), Uniwersytet Jagielloński, 2020; semestralny kurs językoznawstwa korpusowego, Wydział Polonistyki Uniwersytetu Warszawskiego, 2020; semestralny kurs wprowadzający do analizy danych w języku R, Wydział Psychologii Uniwersytetu Warszawskiego, 2020; semestralny kurs Z Excelem przez badania: przygotowanie i prowadzenie badań empirycznych oraz analiza ich wyników w Excelu, Uniwersytet Warszawski, 2022; kursy na Experimental Methods in Language Acquisition Research (EMLAR), Uniwersytet w Utrechcie, 19–21 kwietnia 2022: Statistics with R: beginner, Statistics with R: advanced, Bayesian Statistics I, Bayesian Statistics II, Computational Modelling in Python: Distributional Semantic Models, 2022; szkolenia i warsztaty, np. z zarządzania danymi badawczymi, ICM UW, PON oraz z badań danych leksykograficznych Workshop on Lexicography and Neology, Leibniz-Institut für Deutsche Sprache, Mannheim, 2020 r.; Springer Nature trzy kursy (w j. ang.): Prezentacje akademickie, Komunikacja naukowa i Publikowanie, wszystkie w 2021 r.; Mobilność i integracja w wielojęzycznej Europie: Projektowanie, analiza i ewaluacja polityki językowej, kurs (szkoła), j. ang., Zagrzeb, Chorwacja, 2017 r.; Warsztaty Translating Europe, 2018 r.; szkolenie dotyczące menedżerów bibliografii Mendeley, BUW, Uniwersytet Warszawski, 2021; ICLA Panel on Publishing, 2021; Lancaster Symposium on Innovation in Corpus Linguistics 2021, Wielka Brytania, Uniwersytet w Lancasterze, 2021; Wykład Wprowadzenie do statystyki w językoznawstwie korpusowym (wykład), V. Brezina, Szkoły letnie w językoznawstwie korpusowym: sesje otwarte, Wielka Brytania, Uniwersytet w Lancasterze, 2021; Szkolenie dla wnioskodawców, 13.10.2020; szkolenie dla wnioskodawców z obszaru HS, Narodowe Centrum Nauki, 04.06.2020; Szkolenie z zarządzania danymi badawczymi, szkolenie online ICM UW, BUW, organizator: Platforma Otwartej Nauki PON, 2020.