Speech and Language Technology (SLT)

Posted by wagner.agnieszka on Tue, 25/09/2012 - 10:53

History
Scientific committee and editors
Scope
Author info
Reviewers
The rules of manuscript review
Declaration on the original version
Volumes

History

The yearbook Speech and Language Technology (SLT) has been pubished by the Polish Phonetic Association for almost 40 years (at the beginning under the title "Speech Synthesis and Analysis"). The first Editor-in-Chief was prof. Wiktor Jassem, the second (and present) - prof. UAM Grażyna Demenko.

Scientific committee and editors (2012):

Demenko Grażyna (Adam Mickiewicz University),
Gibbon Dafydd (Uniwersitaet Bielefed, Germany),
Keikichi Hirose (Department of Information and Communication Engineering, University of Tokyo),
Tadeusiewicz Ryszard (AGH University of Science and Technology)

Language editor: Agnieszka Wagner

Technical editor: Mariusz Owsianny

Scope

The papers published in the SLT concern topics from the following areas:

  • speech and language technology (speech synthesis, recognition),
  • speech and language processing,
  • linguistics in general,
  • phonetics and phonology,
  • speech production and perception,
  • speech acoustics,
  • prosody,
  • second language learning (especially as regards pronunciation and prosody training in L2),
  • phonetics in medical applications,
  • language resources (especially as regards creation and annotation of speech and text corpora, and lexica).

Author info

The paper length is between 12-20 pages, i.e. between 3500-6500 words excluding references and including an abstract (in Polish and English) of about 200-300 words. The submitted papers must be written in good English and formatted according to the template available here.

Reviewers

Krzysztof Izdebski (Santa Clara University, Pacific Voice and Speech Foundation, USA),
Andrzej Izworski (AGH University of Science and Technology),
Krzysztof Jassem(Adam Mickiewicz University),
Ela Thurgood (California State University),
Piotr Wierzchon (Adam Mickiewicz University),
Wieslaw Wszolek (AGH University of Science and Technology)

The rules of manuscript review

  • each manuscript is reviewed by at least two independent reviewers not affiliated with the author(s) research centre

  • author(s) of manuscripts and reviewers remain anonymous throughout the review process („double–blind review process”)
  • each review is prepared in a written form and contains an unambiguous conclusion of the reviewer whether to accept or reject the manuscript
  • review form which is the basis of paper assessment is available here
  • names of the reviewers of particular publications and volumes are not revealed

Declaration on the original version
The printed version of the yearbook is the original version.

Volumes
From March 2010 we provide free internet access to the full content of the SLT volumes published since 2006. The current volume (14/15) is fully available here; in case of the previous volumes, persons interested in getting access to the slected papers are kindly requested to write to the editorial board (ptfon@ptfon.pl).
In order to view the contents of the selected volume choose the link from the list below:



vol. 14/15 (2011/2012), current volume

Part 1: Applications

Intonation modeling for neutral-style speech synthesis
Grażyna Demenko, Tomasz Kuczmarski

Overview of HMM-based Speech Synthesis Methods
Tomasz Kuczmarski

Synthetic speech evaluation with speaker adaptive automatic speech recognition
Jolanta Bachan, Tomasz Kuczmarski i Piotr Francuzik

Evaluation of speech recognition system for Polish
Mariusz Owsianny, Piotr Francuzik

Part 2: Resources and tools

Using "Paralingua" database for investigation of affective states and paralinguistic features
Katarzyna Klessa, Agnieszka Wagner, Magdalena Oleśkowicz-Popiel

Preliminary evaluation of the alcohol database
Małgorzata Zagrodnicka

Interlabeller agreement on segmental and prosodic annotation of the Jurisdict Polish database
Marcin Szymański, Jolanta Bachan

Performance of sentence aligners on English Polish bitexts
Grzegorz Krynicki

Part 3: Analysis

On intonation of questions in Korean and Polish task-oriented dialogues Spontaneous speech analysis using perception modelling
Maciej Karpiński, Emilia Szalkowska-Kim

The acoustic realization of long diphthongs of Hainan Cham
Ela Thurgood

Emotional speech production and perception in Polish: A framework of analysis
Agnieszka Wagner

powrót

vol. 14/15 (2011/2012), special edition

Part 1: Methodology (Metodologia)

Empirical models of tone, rhythm and intonation for the analysis of speech prosody (Empiryczne modele tonu, rytmu i intonacji do analizy prozodii mowy)
Daniel Hirst

Formal models of oscillation in rhythm, melody and harmony (Formalne modele oscylacji w rytmie, melodii i harmonii)
Dafydd Gibbon

Timing in conversations: from speech synthesis to robot interaction (Wzorce czasowe w konwersacjach: od syntezy mowy do interakcji z robotem
Nick Campbell

Intonation processing for speech technology (Przetwarzanie intonacji dla technologii mowy)
Grażyna Demenko

powrót

Part 2: Rhythm - duration and timing (Rytm - iloczas i wzorce czasowe)

From research to application: creating and applying models of British RP English rhythm and intonation (Od badań do aplikacji: tworzenie i zastosowanie modeli rytmu i intonacji języka angielskiego brytyjskiego)
David Hill

Rhythm in L2 speech (Rytm w mowie L2)
Ulrike Gut

Polish segmental duration: selected observations based on corpus data (Iloczas głoskowy w języku polskim: obserwacje wybrane w oparciu o dane korpusowe)
Katarzyna Klessa

Acoustic-phonetic realisation of Polish syllable prominence: a corpus study (Akustyczno-fonetyczna realizacja wzmocnienia polskiej sylaby: korpusowe badanie mowy spontanicznej)
Zofia Malisz and Petra Wagner

powrót

Part 3: Melody - intonation and pitch (Melodia - intonacja i wysokość tonu)

An analysis of laryngeal aperture regulation in relation to larynx height change using simultaneous laryngoscopy and laryngeal ultrasound (Analiza regulacji otwarcia względem wysokości krtani z wykorzystaniem jednoczesnej laryngoskopii i ultradźwiękowego obrazowania krtani)
John Esling and Scott R Moisik

Absolute pitch: an unusual type of memory for standard musical scale (Słuch absolutny: niezwykły rodzaj pamięci dotyczący standardowej skali muzycznej)
Andrzej Rakowski

Tones in tunes: a preliminary look at the realization of tone in Mambila song (Tony w melodiach: wstępna analiza realizacji tonu w śpiewie w języku mambila)
Bruce Connell

Acoustic properties and functions of phrase-final rises in Polish task-oriented dialogues (Własności akustyczne i funkcja końcowej melodii wznoszącej frazy intonacyjnej w polskich dialogach zadaniowych)
Maciej Karpiński

Automatic labeling of prosody (Automatyczna anotacja prozodii)
Agnieszka Wagner

powrót

Part 4: Harmony - segments in context (Harmonia - segmenty w kontekście)

NEUTRALIZATION.?! The phonetics-phonology issue in the analysis of word-final obstruent voicing (NEUTRALIZACJA.?! Zagadnienie fonetyki-fonologii w analizie dźwięczności wygłosowych obstruentów)
Klaus J. Kohler

Voicing of word-final obstruent in English connected speech (Dźwięczność wygłosowych obstruentów w mowie ciągłej w języku angielskim)
Wiktor Gonet

Acoustic cues to glottal stops in Polish-accented English (Akustyczne cechy wskazujące zwarcia krtaniowe w języku angielskim z polskim akcentem)
Anna Balas

Holistic perception of phonological variants (Holistyczna percepcja wariantów fonologicznych)
Linda Shockey and Zinny Bond

Israeli Hebrew and Hungarian interaction: phonetic/phonological Issues (Interakcja między współczesnym hebrajskim i węgierskim: zagadnienia fonetyczne/fonologiczne)
Judith Rosenhouse

powrót

Part 5: Biography and bibliography (Biografia i bibliografia)

Views and vita (Przemyślenia i życiorys)

Publications of Wiktor Jassem (Publikacje Wiktora Jassema)

powrót


vol. 12/13 (2009/2010)

Part 1: Phoniatrics (edited by Krzysztof Izdebski)

Integrated Spatio-Temporal Analysis of High-Speed Laryngeal Imaging and Acoustic Signals: Their Role and Applications in the Study of Normal and Abnormal Vocal Functions (Zintegrowana przestrzenno-czasowa analiza wysokoczułego obrazowania krtani i sygnałów akustycznych: ich rola i zastosowanie w badaniu prawidłowych i nieprawidłowych funkcji głosu)
Yuling Yan, Krzysztof Izdebski

Outcome of F0 determination using acoustic and electroglottographic algorithms (Wyniki wyznaczania F0 z wykorzystaniem algorytmów akustycznych i elektroglotograficznych)
Wiesław Wszołek, Maciej Kłaczyński

Expressive speech as a tool for human-computer interaction (Mowa ekspresywna jako narzędzie interakcji człowiek-komputer)
Grażyna Demenko

In search of a framework for speech emotion recognition (W poszukiwaniu ram koncepcyjnych dla rozpoznawania emocji w mowie)
Magdalena Jastrzębska

powrót

Part 2: Language processing (edited by Dafydd Gibbon)

A comparison of search algorithms for syntax-based statistical machine translation (Porównanie algorytmów wyszukiwania dla opartego na składni tłumaczenia maszynowego)
Marcin Junczys-Dowmunt

An attempt to automatically translate into the sign language emotionally colored textual utterances (Próba automatycznego tłumaczenia na język migowy emocjonalnie zabarwionych wypowiedzi tekstowych)
Julia Romaniuk, Nina Suszczańska, Przemysław Szmal

A sentence Clustering Algorithm for Specialized Translation Memories (Analiza skupień zdań na potrzeby wyspecjalizowanych pamięci tłumaczeń)
Rafał Jaworski

Classification of translation pairs for the purpose of creating domain dictionaries (Klasyfikacja par tłumaczeń dla tworzenia dużych słowników dziedzinowych)
Marcin Walas

Comparison of selected morphological analysers for Polish (Porównanie wybranych analizatorów morfologicznych dla języka polskiego)
Błażej Adamczyk

powrót

Part 3: Phonetics (edited by Elżbieta Thurgood)

Tonal variation in identical and conflicting contexts: A case study of Anong disyllabic utterances (Wariantywność tonalna w identycznych i sprzecznych kontekstach: studium dwusylabowych wypowiedzi języka Anong)
Ela Thurgood

Creation of the linguistic content for the pronunciation tutoring system AzAR 3.0 (Tworzenie zawartości językowej dla systemu do treningu wymowy AzAR 3.0)
Agnieszka Wagner, Natalia Cylwik

Prosodic inference with the ZDATR default inference engine (Prozodyczne wnioskowanie z domyślnym silnikiem wnioskowania ZDATR)
Dafydd Gibbon

powrót

Part 4: Speech synthesis and recognition (edited by Ryszard Tadeusiewicz)

SOM network for LVCSR Speech Recognition (Sieć SOM dla rozpoznawania mowy LVCSR)
Leszek Gajecki, Ryszard Tadeusiewicz
Speechlabs ASR. Polish Lexical Database for Speech Technology: Design and Architecture (Speechlabs ASR: Polska Leksykalna Baza Danych do zastosowań w technologii mowy. Projekt i architektura)
Katarzyna Klessa, Maciej Karpiński, Olga Bałdys, Grażyna Demenko

Speaker adaptation in speech recognition systems using neural networks (Adaptacja mówcy w systemach rozpoznawania mowy za pomocą sieci neuronowych)
Michał Dyrek

HMM-based Speech Synthesis Applied to Polish (System syntezy mowy oparty na ukrytych modelach Markowa
dla języka polskiego)

Tomasz Kuczmarski

Tools for automatisation of voice creation for diphone based speech synthesis (Narzędzia do automatyzacji tworzenia głosów dla difonowej syntezy mowy)
Jolanta Bachan

powrót

Part 5: Reports and technical papers (edited by Zbigniew Rau)

Speech perception and the application of automatic speech recognition system for the recording of testimonies
made in the course of court proceedings

Anna Demenko

Human voice as a right protected by the law
Jakub Dąbrowski

Automatic speech recognition systems (ASRS) in homeland security systems – their use in
police operations

Zbigniew Rau, Dariusz Pilarczyk

Technologies of processing and recognition of verbal information in homeland security systems (Technologie przetwarzania oraz rozpoznawania informacji słownych w systemach bezpieczeństwa wewnętrznego)
Grażyna Demenko, Stefan Grocholewski

powrót

vol. 11 (2008)

Part 1: Speech and speaker recognition

Modeling of man auditory system as a method for automatic speech recognition systems improvement (Modelowanie systemu słuchowego człowieka jako metoda doskonalenia systemów automatycznego rozpoznawania mowy)
Ryszard Tadeusiewicz

Acoustical parameters of target voices and their imitators
Wojciech Majewski and Piotr Staroniewicz

First evaluation of Polish LVCSR acoustic models obtained from the JURISDIC database
Marcin Szymański, Jerzy Ogórkiewicz, Marek Lange, Katarzyna Klessa,
Stefan Grocholewski, and Grażyna Demenko

An Investigation into the Intra- and Inter-labeller Agreement in the JURISDIC Database
Katarzyna Klessa and Jolanta Bachan

Telephony Based Voice Portal for a University
Łukasz Brocki, Danijel Koržinek, Krzysztof Marasek

The system architecture of a speech database via the WWW (Baza nagrań głosowych z dostępem poprzez Internet)
Andrzej Izworski, Piotr Pracuch, Jarosław Bułka, and Ireneusz Wochlik

Modeling of Polish language for Large Vocabulary Continuous Speech Recognition (Modelowanie języka polskiego dla ciągłego rozpoznawania mowy z uwzględnieniem obszernego zakresu słownictwa)
Leszek Gajecki and Ryszard Tadeusiewicz

powrót

Part 2: Speech analysis and synthesis

Synthesis of F0contours for Mandarin speech by superposing corpus-generated tone contours on rule-generated phrase components
Keikichi Hirose, Qinghua Sun, and Nobuaki Minematsu

The design of Polish Speech Corpus for Unit Selection Speech Synthesis
Grażyna Demenko, Bernd Möbius, and Katarzyna Klessa

A Model of Personalized Audio-Visual TTS-synthesis for Russian
B. Lobanov, L. Tsirulnik, A. Ronzhin, and A. Karpov

Preliminary Results of Expressive Speech Synthesis in Polish
Jolanta Bachan and Barbara Surmanowicz

Aspects of gestural and prosodic structure of multimodal utterances in Polish task-oriented dialogues
Maciej Karpiński, Ewa Jarmołowicz-Nowikow, and Zofia Malisz

The use of CALL in acquiring foreign language pronunciation and prosody – General specifications for Euronounce Project
N. Cylwik, G. Demenko, O. Jokisch, R. Jäckel, M. Rusko, R. Hoffmann, A. Ronzhin, D. Hirschfeld, U. Koloska, and L. Hanisch

An acoustic database gathered for the purpose of creating a detector of selected pronunciation errors appearing in English spoken by Poles (Akustyczna baza danych zgromadzona na potrzeby układu detekcji wybranych błędów wymowy w mowie angielskiej Polaków)
Grzegorz Krynicki, Dawid Pietrala, Katarzyna Dziubalska-Kołaczyk, Mikołaj Wypych

Automatic assessment of distortions in isolated sounds in dysarthia disease (Automatyczna ocena zaburzeń realizacji głosek w dyzartrii)
Tomasz Orzechowski, Katarzyna Chmurzyńska, Piotr Radkowski, Andrzej Izworski

Computational tools in the analysis of phonetic grammar
Krzysztof Dyczkowski, Norbert Kordek, Paweł Nowakowski, and Krzysztof Stroński

powrót

Part 3: Language processing

English grapheme-to-phoneme conversion and evaluation
Uwe Reichel, Hartmut R. Pfitzinger, and Horst-Udo Hain

Automatic correction of part-of-speech corpora
Uwe Reichel, Lia Saki Bucar Shigemori

Semantic Modelling for Speech Recognition
Bartosz Ziółko, Suresh Manandhar, Richard C. Wilson, and Mariusz Ziółko

Problems of Disambiguation in the Thetos-3 System
Nina Suszczańska, Przemysław Szmal

Corpora based Approach for Arabic/English Word Translation Disambiguation
Farag Ahmed and Andreas Nürnberger

Overcoming Agglutination Difficulties in the Development of an MT system from the Azerbaijani Language
Rauf Fatullayev, Ali Abbasov, and Abulfat Fatullayev

A Linguistically Light Approach to Multilingualism in Lexical Layers for Ontologies
Alexander Troussov, John Judge, Mikhail Sogrin, Amine Akrout, Brian Davis, and Siegfried Handschuh

SuperMatrix: A General Tool for Lexical Semantic Knowledge Acquisition
Bartosz Broda and Maciej Piasecki

Modeling the Frequency of Phrasal Verbs with Search Engines
Grażyna Chamielec and Dawid Weiss

SemCAPTCHA - the user-friendly alternative for OCR-based CAPTCHA systems
Paweł Łupkowski and Mariusz Urbański

powrót


vol. 9/10 (2006/2007)

Part 1: Phonetics and Phonology (Fonetyka i Fonologia)

Homophones in Polish (Polskie homofony)
Maria Steffen-Batóg, Tadeusz Batóg

Disfluencies in Polish and Thai task-oriented dialogue (Zaburzenia płynności w polskich i tajskich dialogach zadaniowych)
Janusz Kleśta, Maciej Karpiński

A set of speech perception tests for children with cochlear implants – preliminary evaluation (Zestaw testów percepcyjnych mowy dla dzieci z implantami ślimakowymi – wstępna ewaluacja)
Jerzy Ogórkiewicz, Jolanta Bachan, Małgorzata Mazur, Mariusz Owsianny, Dariusz Komar, Grażyna Demenko

Elliptic sentences processing in the Thetos translation system (Przetwarzanie zdań eliptycznych w systemie tłumaczącym Thetos)
Nina Suszczańska, Julia Romaniuk, Przemysław Szmal

powrót

Part 2: Prosodic Analysis (Analiza Prozodyczna)

Prosody of Hungarian Imperative Sentences (Prozodia węgierskich zdań rozkazujących)
Ilona Koutny

Prosodic features in simultaneous interpreting (Cechy prozodyczne w tłumaczeniu symultanicznym)
Natalia Cylwik

Sentence Intonation for Polish Language (Prozodia wypowiedzi w języku polskim)
Bożena Piorkówska, Janusz Rafałko, Wojciech Lesiński, Edward Szpilewski

A Study of Chosen Temporal Relations within Syllable Structure in Polish (Analiza wybranych związków iloczasowych zachodzących w obrębie sylaby w języku polskim)
Katarzyna Klessa, Daniel Śledziński

powrót

Part 3: Speech synthesis and speech recognition (Synteza i Rozpoznawanie Mowy)

Study of Idiosyncrasy of Syntagmatic Segmentation for Personal Speaking Manner Cloning by TTS
Boris Lobanov, Liliya Tsirulnik, Anatoly Fiodorov

Talking blogs – an attempt to give weblogs a voice Adding TTS functionality to Wordpress
Arne Hellmich

Automatic Close Copy Speech Synthesis (Synteza mowy metodą automatycznego dokładnego kopiowania)
Jolanta Bachan

The role of discourse markers in the synthesis of Hungarian prosody (Rola markerów dyskursu w syntezie prozodii węgierskiej)
Ilona Koutny

Building speaker identification systgem using Hidden Markov Model Toolkit (Rozpoznawanie mówców przy pomocy zestawu narzędzi HTK)
Marek Lange

Semi-automatic segmentation of speech: manual segmentation strategy based on error prediction (Pół-automatyczna segmentacja nagrań mowy: strategia segmentacji ręcznej w oparciu o predykcję błędu
Marcin Szymański and Stefan Grocholewski

The use of statistics of Polish phonemes in speech Recognition (Zastosowanie statystyk fonemów języka polskiego w rozpoznawaniu mowy)
Bartosz Ziółko, Jakub Gałka, Suresh Manandhar, Richard C. Wilson, Mariusz Ziółko

Building lexica for application in a speech dictation system (Tworzenie leksykonów do zastosowania w systemie dyktowania mowy)
Agnieszka Wagner, Grażyna Demenko

Acoustical Analysis of the Polish Syllables for Needs of the Speech Technology (Analiza cech akustycznych sylab języka polskiego na potrzeby technologii mowy)
Daniel Śledziński

The evaluation of recordings’ quality in the database created for the automatic speech recognition system (Ocena jakości nagrań w bazie danych dla systemu rozpoznawania mowy)
Daniel Śledziński

powrót