Speech and Language Technology (SLT)
History
Scientific committee and editors
Scope
Author info
Reviewers
The rules of manuscript review
Declaration on the original version
Volumes
History
The yearbook Speech and Language Technology (SLT) has been pubished by the Polish Phonetic Association for almost 40 years (at the beginning under the title "Speech Synthesis and Analysis"). The first Editor-in-Chief was prof. Wiktor Jassem, the second (and present) - prof. UAM Grażyna Demenko.
Scientific committee and editors (2012):
Demenko Grażyna (Adam Mickiewicz University),
Gibbon Dafydd (Uniwersitaet Bielefed, Germany),
Keikichi Hirose (Department of Information and Communication Engineering, University of Tokyo),
Tadeusiewicz Ryszard (AGH University of Science and Technology)
Language editor: Agnieszka Wagner
Technical editor: Mariusz Owsianny
The papers published in the SLT concern topics from the following areas:
- speech and language technology (speech synthesis, recognition),
- speech and language processing,
- linguistics in general,
- phonetics and phonology,
- speech production and perception,
- speech acoustics,
- prosody,
- second language learning (especially as regards pronunciation and prosody training in L2),
- phonetics in medical applications,
- language resources (especially as regards creation and annotation of speech and text corpora, and lexica).
The paper length is between 12-20 pages, i.e. between 3500-6500 words excluding references and including an abstract (in Polish and English) of about 200-300 words. The submitted papers must be written in good English and formatted according to the template available here.
Krzysztof Izdebski (Santa Clara University, Pacific Voice and Speech Foundation, USA),
Andrzej Izworski (AGH University of Science and Technology),
Krzysztof Jassem(Adam Mickiewicz University),
Ela Thurgood (California State University),
Piotr Wierzchon (Adam Mickiewicz University),
Wieslaw Wszolek (AGH University of Science and Technology)
The rules of manuscript review
- each manuscript is reviewed by at least two independent reviewers not affiliated with the author(s) research centre
- author(s) of manuscripts and reviewers remain anonymous throughout the review process („double–blind review process”)
- each review is prepared in a written form and contains an unambiguous conclusion of the reviewer whether to accept or reject the manuscript
- review form which is the basis of paper assessment is available here
- names of the reviewers of particular publications and volumes are not revealed
Declaration on the original version
The printed version of the yearbook is the original version.
Volumes
From March 2010 we provide free internet access to the full content of the SLT volumes published since 2006. The current volume (14/15) is fully available here; in case of the previous volumes, persons interested in getting access to the slected papers are kindly requested to write to the editorial board (ptfon@ptfon.pl).
In order to view the contents of the selected volume choose the link from the list below:
- vol. 14/15 (2011/2012), current volume
- vol. 14/15 (2011/2012), special edition
- vol. 12/13 (2009/2010)
- vol. 11 (2008)
- vol. 9/10 (2006/2007)
vol. 14/15 (2011/2012), current volume
Part 1: Applications
Intonation modeling for neutral-style speech synthesis
Grażyna Demenko, Tomasz Kuczmarski
Overview of HMM-based Speech Synthesis Methods
Tomasz Kuczmarski
Synthetic speech evaluation with speaker adaptive automatic speech recognition
Jolanta Bachan, Tomasz Kuczmarski i Piotr Francuzik
Evaluation of speech recognition system for Polish
Mariusz Owsianny, Piotr Francuzik
Part 2: Resources and tools
Using "Paralingua" database for investigation of affective states and paralinguistic features
Katarzyna Klessa, Agnieszka Wagner, Magdalena Oleśkowicz-Popiel
Preliminary evaluation of the alcohol database
Małgorzata Zagrodnicka
Interlabeller agreement on segmental and prosodic annotation of the Jurisdict Polish database
Marcin Szymański, Jolanta Bachan
Performance of sentence aligners on English Polish bitexts
Grzegorz Krynicki
Part 3: Analysis
On intonation of questions in Korean and Polish task-oriented dialogues Spontaneous speech analysis using perception modelling
Maciej Karpiński, Emilia Szalkowska-Kim
The acoustic realization of long diphthongs of Hainan Cham
Ela Thurgood
Emotional speech production and perception in Polish: A framework of analysis
Agnieszka Wagner
vol. 14/15 (2011/2012), special edition
Part 1: Methodology (Metodologia)
Empirical models of tone, rhythm and intonation for the analysis of speech prosody (Empiryczne modele tonu, rytmu i intonacji do analizy prozodii mowy)
Daniel Hirst
Formal models of oscillation in rhythm, melody and harmony (Formalne modele oscylacji w rytmie, melodii i harmonii)
Dafydd Gibbon
Timing in conversations: from speech synthesis to robot interaction (Wzorce czasowe w konwersacjach: od syntezy mowy do interakcji z robotem
Nick Campbell
Intonation processing for speech technology (Przetwarzanie intonacji dla technologii mowy)
Grażyna Demenko
Part 2: Rhythm - duration and timing (Rytm - iloczas i wzorce czasowe)
From research to application: creating and applying models of British RP English rhythm and intonation (Od badań do aplikacji: tworzenie i zastosowanie modeli rytmu i intonacji języka angielskiego brytyjskiego)
David Hill
Rhythm in L2 speech (Rytm w mowie L2)
Ulrike Gut
Polish segmental duration: selected observations based on corpus data (Iloczas głoskowy w języku polskim: obserwacje wybrane w oparciu o dane korpusowe)
Katarzyna Klessa
Acoustic-phonetic realisation of Polish syllable prominence: a corpus study (Akustyczno-fonetyczna realizacja wzmocnienia polskiej sylaby: korpusowe badanie mowy spontanicznej)
Zofia Malisz and Petra Wagner
Part 3: Melody - intonation and pitch (Melodia - intonacja i wysokość tonu)
An analysis of laryngeal aperture regulation in relation to larynx height change using simultaneous laryngoscopy and laryngeal ultrasound (Analiza regulacji otwarcia względem wysokości krtani z wykorzystaniem jednoczesnej laryngoskopii i ultradźwiękowego obrazowania krtani)
John Esling and Scott R Moisik
Absolute pitch: an unusual type of memory for standard musical scale (Słuch absolutny: niezwykły rodzaj pamięci dotyczący standardowej skali muzycznej)
Andrzej Rakowski
Tones in tunes: a preliminary look at the realization of tone in Mambila song (Tony w melodiach: wstępna analiza realizacji tonu w śpiewie w języku mambila)
Bruce Connell
Acoustic properties and functions of phrase-final rises in Polish task-oriented dialogues (Własności akustyczne i funkcja końcowej melodii wznoszącej frazy intonacyjnej w polskich dialogach zadaniowych)
Maciej Karpiński
Automatic labeling of prosody (Automatyczna anotacja prozodii)
Agnieszka Wagner
Part 4: Harmony - segments in context (Harmonia - segmenty w kontekście)
NEUTRALIZATION.?! The phonetics-phonology issue in the analysis of word-final obstruent voicing (NEUTRALIZACJA.?! Zagadnienie fonetyki-fonologii w analizie dźwięczności wygłosowych obstruentów)
Klaus J. Kohler
Voicing of word-final obstruent in English connected speech (Dźwięczność wygłosowych obstruentów w mowie ciągłej w języku angielskim)
Wiktor Gonet
Acoustic cues to glottal stops in Polish-accented English (Akustyczne cechy wskazujące zwarcia krtaniowe w języku angielskim z polskim akcentem)
Anna Balas
Holistic perception of phonological variants (Holistyczna percepcja wariantów fonologicznych)
Linda Shockey and Zinny Bond
Israeli Hebrew and Hungarian interaction: phonetic/phonological Issues (Interakcja między współczesnym hebrajskim i węgierskim: zagadnienia fonetyczne/fonologiczne)
Judith Rosenhouse
Part 5: Biography and bibliography (Biografia i bibliografia)
Views and vita (Przemyślenia i życiorys)
Publications of Wiktor Jassem (Publikacje Wiktora Jassema)
vol. 12/13 (2009/2010)
Part 1: Phoniatrics (edited by Krzysztof Izdebski)
Integrated Spatio-Temporal Analysis of High-Speed Laryngeal Imaging and Acoustic Signals: Their Role and Applications in the Study of Normal and Abnormal Vocal Functions (Zintegrowana przestrzenno-czasowa analiza wysokoczułego obrazowania krtani i sygnałów akustycznych: ich rola i zastosowanie w badaniu prawidłowych i nieprawidłowych funkcji głosu)
Yuling Yan, Krzysztof Izdebski
Outcome of F0 determination using acoustic and electroglottographic algorithms (Wyniki wyznaczania F0 z wykorzystaniem algorytmów akustycznych i elektroglotograficznych)
Wiesław Wszołek, Maciej Kłaczyński
Expressive speech as a tool for human-computer interaction (Mowa ekspresywna jako narzędzie interakcji człowiek-komputer)
Grażyna Demenko
In search of a framework for speech emotion recognition (W poszukiwaniu ram koncepcyjnych dla rozpoznawania emocji w mowie)
Magdalena Jastrzębska
Part 2: Language processing (edited by Dafydd Gibbon)
A comparison of search algorithms for syntax-based statistical machine translation (Porównanie algorytmów wyszukiwania dla opartego na składni tłumaczenia maszynowego)
Marcin Junczys-Dowmunt
An attempt to automatically translate into the sign language emotionally colored textual utterances (Próba automatycznego tłumaczenia na język migowy emocjonalnie zabarwionych wypowiedzi tekstowych)
Julia Romaniuk, Nina Suszczańska, Przemysław Szmal
A sentence Clustering Algorithm for Specialized Translation Memories (Analiza skupień zdań na potrzeby wyspecjalizowanych pamięci tłumaczeń)
Rafał Jaworski
Classification of translation pairs for the purpose of creating domain dictionaries (Klasyfikacja par tłumaczeń dla tworzenia dużych słowników dziedzinowych)
Marcin Walas
Comparison of selected morphological analysers for Polish (Porównanie wybranych analizatorów morfologicznych dla języka polskiego)
Błażej Adamczyk
Part 3: Phonetics (edited by Elżbieta Thurgood)
Tonal variation in identical and conflicting contexts: A case study of Anong disyllabic utterances (Wariantywność tonalna w identycznych i sprzecznych kontekstach: studium dwusylabowych wypowiedzi języka Anong)
Ela Thurgood
Creation of the linguistic content for the pronunciation tutoring system AzAR 3.0 (Tworzenie zawartości językowej dla systemu do treningu wymowy AzAR 3.0)
Agnieszka Wagner, Natalia Cylwik
Prosodic inference with the ZDATR default inference engine (Prozodyczne wnioskowanie z domyślnym silnikiem wnioskowania ZDATR)
Dafydd Gibbon
Part 4: Speech synthesis and recognition (edited by Ryszard Tadeusiewicz)
SOM network for LVCSR Speech Recognition (Sieć SOM dla rozpoznawania mowy LVCSR)
Leszek Gajecki, Ryszard Tadeusiewicz
Speechlabs ASR. Polish Lexical Database for Speech Technology: Design and Architecture (Speechlabs ASR: Polska Leksykalna Baza Danych do zastosowań w technologii mowy. Projekt i architektura)
Katarzyna Klessa, Maciej Karpiński, Olga Bałdys, Grażyna Demenko
Speaker adaptation in speech recognition systems using neural networks (Adaptacja mówcy w systemach rozpoznawania mowy za pomocą sieci neuronowych)
Michał Dyrek
HMM-based Speech Synthesis Applied to Polish (System syntezy mowy oparty na ukrytych modelach Markowa
dla języka polskiego)
Tomasz Kuczmarski
Tools for automatisation of voice creation for diphone based speech synthesis (Narzędzia do automatyzacji tworzenia głosów dla difonowej syntezy mowy)
Jolanta Bachan
Part 5: Reports and technical papers (edited by Zbigniew Rau)
Speech perception and the application of automatic speech recognition system for the recording of testimonies
made in the course of court proceedings
Anna Demenko
Human voice as a right protected by the law
Jakub Dąbrowski
Automatic speech recognition systems (ASRS) in homeland security systems – their use in
police operations
Zbigniew Rau, Dariusz Pilarczyk
Technologies of processing and recognition of verbal information in homeland security systems (Technologie przetwarzania oraz rozpoznawania informacji słownych w systemach bezpieczeństwa wewnętrznego)
Grażyna Demenko, Stefan Grocholewski
vol. 11 (2008)
Part 1: Speech and speaker recognition
Modeling of man auditory system as a method for automatic speech recognition systems improvement (Modelowanie systemu słuchowego człowieka jako metoda doskonalenia systemów automatycznego rozpoznawania mowy)
Ryszard Tadeusiewicz
Acoustical parameters of target voices and their imitators
Wojciech Majewski and Piotr Staroniewicz
First evaluation of Polish LVCSR acoustic models obtained from the JURISDIC database
Marcin Szymański, Jerzy Ogórkiewicz, Marek Lange, Katarzyna Klessa,
Stefan Grocholewski, and Grażyna Demenko
An Investigation into the Intra- and Inter-labeller Agreement in the JURISDIC Database
Katarzyna Klessa and Jolanta Bachan
Telephony Based Voice Portal for a University
Łukasz Brocki, Danijel Koržinek, Krzysztof Marasek
The system architecture of a speech database via the WWW (Baza nagrań głosowych z dostępem poprzez Internet)
Andrzej Izworski, Piotr Pracuch, Jarosław Bułka, and Ireneusz Wochlik
Modeling of Polish language for Large Vocabulary Continuous Speech Recognition (Modelowanie języka polskiego dla ciągłego rozpoznawania mowy z uwzględnieniem obszernego zakresu słownictwa)
Leszek Gajecki and Ryszard Tadeusiewicz
Part 2: Speech analysis and synthesis
Synthesis of F0contours for Mandarin speech by superposing corpus-generated tone contours on rule-generated phrase components
Keikichi Hirose, Qinghua Sun, and Nobuaki Minematsu
The design of Polish Speech Corpus for Unit Selection Speech Synthesis
Grażyna Demenko, Bernd Möbius, and Katarzyna Klessa
A Model of Personalized Audio-Visual TTS-synthesis for Russian
B. Lobanov, L. Tsirulnik, A. Ronzhin, and A. Karpov
Preliminary Results of Expressive Speech Synthesis in Polish
Jolanta Bachan and Barbara Surmanowicz
Aspects of gestural and prosodic structure of multimodal utterances in Polish task-oriented dialogues
Maciej Karpiński, Ewa Jarmołowicz-Nowikow, and Zofia Malisz
The use of CALL in acquiring foreign language pronunciation and prosody – General specifications for Euronounce Project
N. Cylwik, G. Demenko, O. Jokisch, R. Jäckel, M. Rusko, R. Hoffmann, A. Ronzhin, D. Hirschfeld, U. Koloska, and L. Hanisch
An acoustic database gathered for the purpose of creating a detector of selected pronunciation errors appearing in English spoken by Poles (Akustyczna baza danych zgromadzona na potrzeby układu detekcji wybranych błędów wymowy w mowie angielskiej Polaków)
Grzegorz Krynicki, Dawid Pietrala, Katarzyna Dziubalska-Kołaczyk, Mikołaj Wypych
Automatic assessment of distortions in isolated sounds in dysarthia disease (Automatyczna ocena zaburzeń realizacji głosek w dyzartrii)
Tomasz Orzechowski, Katarzyna Chmurzyńska, Piotr Radkowski, Andrzej Izworski
Computational tools in the analysis of phonetic grammar
Krzysztof Dyczkowski, Norbert Kordek, Paweł Nowakowski, and Krzysztof Stroński
Part 3: Language processing
English grapheme-to-phoneme conversion and evaluation
Uwe Reichel, Hartmut R. Pfitzinger, and Horst-Udo Hain
Automatic correction of part-of-speech corpora
Uwe Reichel, Lia Saki Bucar Shigemori
Semantic Modelling for Speech Recognition
Bartosz Ziółko, Suresh Manandhar, Richard C. Wilson, and Mariusz Ziółko
Problems of Disambiguation in the Thetos-3 System
Nina Suszczańska, Przemysław Szmal
Corpora based Approach for Arabic/English Word Translation Disambiguation
Farag Ahmed and Andreas Nürnberger
Overcoming Agglutination Difficulties in the Development of an MT system from the Azerbaijani Language
Rauf Fatullayev, Ali Abbasov, and Abulfat Fatullayev
A Linguistically Light Approach to Multilingualism in Lexical Layers for Ontologies
Alexander Troussov, John Judge, Mikhail Sogrin, Amine Akrout, Brian Davis, and Siegfried Handschuh
SuperMatrix: A General Tool for Lexical Semantic Knowledge Acquisition
Bartosz Broda and Maciej Piasecki
Modeling the Frequency of Phrasal Verbs with Search Engines
Grażyna Chamielec and Dawid Weiss
SemCAPTCHA - the user-friendly alternative for OCR-based CAPTCHA systems
Paweł Łupkowski and Mariusz Urbański
vol. 9/10 (2006/2007)
Part 1: Phonetics and Phonology (Fonetyka i Fonologia)
Homophones in Polish (Polskie homofony)
Maria Steffen-Batóg, Tadeusz Batóg
Disfluencies in Polish and Thai task-oriented dialogue (Zaburzenia płynności w polskich i tajskich dialogach zadaniowych)
Janusz Kleśta, Maciej Karpiński
A set of speech perception tests for children with cochlear implants – preliminary evaluation (Zestaw testów percepcyjnych mowy dla dzieci z implantami ślimakowymi – wstępna ewaluacja)
Jerzy Ogórkiewicz, Jolanta Bachan, Małgorzata Mazur, Mariusz Owsianny, Dariusz Komar, Grażyna Demenko
Elliptic sentences processing in the Thetos translation system (Przetwarzanie zdań eliptycznych w systemie tłumaczącym Thetos)
Nina Suszczańska, Julia Romaniuk, Przemysław Szmal
Part 2: Prosodic Analysis (Analiza Prozodyczna)
Prosody of Hungarian Imperative Sentences (Prozodia węgierskich zdań rozkazujących)
Ilona Koutny
Prosodic features in simultaneous interpreting (Cechy prozodyczne w tłumaczeniu symultanicznym)
Natalia Cylwik
Sentence Intonation for Polish Language (Prozodia wypowiedzi w języku polskim)
Bożena Piorkówska, Janusz Rafałko, Wojciech Lesiński, Edward Szpilewski
A Study of Chosen Temporal Relations within Syllable Structure in Polish (Analiza wybranych związków iloczasowych zachodzących w obrębie sylaby w języku polskim)
Katarzyna Klessa, Daniel Śledziński
Part 3: Speech synthesis and speech recognition (Synteza i Rozpoznawanie Mowy)
Study of Idiosyncrasy of Syntagmatic Segmentation for Personal Speaking Manner Cloning by TTS
Boris Lobanov, Liliya Tsirulnik, Anatoly Fiodorov
Talking blogs – an attempt to give weblogs a voice Adding TTS functionality to Wordpress
Arne Hellmich
Automatic Close Copy Speech Synthesis (Synteza mowy metodą automatycznego dokładnego kopiowania)
Jolanta Bachan
The role of discourse markers in the synthesis of Hungarian prosody (Rola markerów dyskursu w syntezie prozodii węgierskiej)
Ilona Koutny
Building speaker identification systgem using Hidden Markov Model Toolkit (Rozpoznawanie mówców przy pomocy zestawu narzędzi HTK)
Marek Lange
Semi-automatic segmentation of speech: manual segmentation strategy based on error prediction (Pół-automatyczna segmentacja nagrań mowy: strategia segmentacji ręcznej w oparciu o predykcję błędu
Marcin Szymański and Stefan Grocholewski
The use of statistics of Polish phonemes in speech Recognition (Zastosowanie statystyk fonemów języka polskiego w rozpoznawaniu mowy)
Bartosz Ziółko, Jakub Gałka, Suresh Manandhar, Richard C. Wilson, Mariusz Ziółko
Building lexica for application in a speech dictation system (Tworzenie leksykonów do zastosowania w systemie dyktowania mowy)
Agnieszka Wagner, Grażyna Demenko
Acoustical Analysis of the Polish Syllables for Needs of the Speech Technology (Analiza cech akustycznych sylab języka polskiego na potrzeby technologii mowy)
Daniel Śledziński
The evaluation of recordings’ quality in the database created for the automatic speech recognition system (Ocena jakości nagrań w bazie danych dla systemu rozpoznawania mowy)
Daniel Śledziński