Транскрипция: /ˈkɔː.pəs/
Определение:
Corpus is a large collection of written or spoken texts used for studying a language.
Corpus — это большое собрание письменных или устных текстов, используемое для изучения языка.
Перевод:
- корпус (текстов)
- собрание (научных данных, документов)
- совокупность материалов по теме
Особенности употребления:
- Употребляется в лингвистике, юриспруденции, медицине и других научных сферах.
- Во множественном числе — corpora /ˈkɔː.pər.ə/.
- Часто используется с уточнением: linguistic corpus, legal corpus, medical corpus.
Синонимы: collection, body, archive
Антонимы: fragment, excerpt (в значении части)
10 фраз с переводом
- We studied a large linguistic corpus.
Мы изучали большой лингвистический корпус. - The corpus contains thousands of legal documents.
Корпус содержит тысячи юридических документов. - This corpus includes modern spoken English.
Этот корпус включает современную разговорную речь. - A new corpus of medical texts was created.
Был создан новый корпус медицинских текстов. - They use a historical corpus for analysis.
Они используют исторический корпус для анализа. - The corpus helps researchers understand patterns.
Корпус помогает исследователям понять закономерности. - A digital corpus allows for easier search.
Цифровой корпус облегчает поиск. - The corpus was compiled over several years.
Корпус собирался в течение нескольких лет. - Students accessed the corpus online.
Студенты получили доступ к корпусу онлайн. - The corpus is constantly being updated.
Корпус постоянно обновляется.
10 диалогов с переводом
— What is a corpus?
— It’s a collection of texts used for research.
— Что такое корпус?
— Это собрание текстов для исследования.
— Where did you find this corpus?
— On a university database.
— Где ты нашёл этот корпус?
— В университетской базе данных.
— Is the corpus freely available?
— Yes, it’s open-access.
— Этот корпус доступен?
— Да, он в открытом доступе.
— What kind of texts are in this corpus?
— Mainly 19th-century newspapers.
— Какие тексты в этом корпусе?
— В основном газеты XIX века.
— Why do you use a corpus?
— To analyze language trends.
— Зачем ты используешь корпус?
— Чтобы анализировать языковые тенденции.
— How big is the corpus?
— Over two million words.
— Насколько большой корпус?
— Более двух миллионов слов.
— Is the corpus tagged by grammar?
— Yes, it’s fully annotated.
— Корпус размечен по грамматике?
— Да, он полностью аннотирован.
— Can I contribute to the corpus?
— Sure, if your texts meet the criteria.
— Можно добавить тексты в корпус?
— Конечно, если они соответствуют требованиям.
— What’s the difference between a corpus and a database?
— A corpus is specialized for linguistic research.
— В чём разница между корпусом и базой данных?
— Корпус предназначен специально для языковых исследований.
— Is this corpus multilingual?
— Yes, it includes ten languages.
— Этот корпус многоязычный?
— Да, он включает десять языков.
5 рассказов с переводом и словарём
The Linguistic Corpus
Лингвистический корпус
Emily was studying old English words. Her professor gave her access to a linguistic corpus containing writings from the 1600s. As she read, she discovered unusual spellings and grammar. It fascinated her.
Эмили изучала старые английские слова. Профессор дал ей доступ к лингвистическому корпусу, содержащему тексты XVII века. Пока она читала, она обнаруживала необычные написания и грамматику. Это её увлекло.
Словарь:
Corpus /ˈkɔː.pəs/ — корпус
Access /ˈæk.ses/ — доступ
Fascinate /ˈfæs.ən.eɪt/ — увлекать
Grammar /ˈɡræm.ər/ — грамматика
Spelling /ˈspel.ɪŋ/ — правописание
A Legal Corpus in Court
Юридический корпус в суде
During the trial, the lawyer referenced a legal corpus of past decisions. Using this, she proved her case. The judge was impressed by her research skills.
Во время судебного разбирательства адвокат сослалась на юридический корпус прошлых решений. Благодаря этому она доказала свою правоту. Судья был впечатлён её исследовательскими навыками.
Словарь:
Trial /ˈtraɪ.əl/ — суд
Lawyer /ˈlɔː.jər/ — адвокат
Decision /dɪˈsɪʒ.ən/ — решение
Judge /dʒʌdʒ/ — судья
Research /rɪˈsɜːtʃ/ — исследование
Building a Spoken Corpus
Создание устного корпуса
Linguists recorded thousands of everyday conversations to create a spoken corpus. The goal was to analyze real speech. It helped improve translation tools.
Лингвисты записали тысячи повседневных разговоров, чтобы создать устный корпус. Целью было проанализировать живую речь. Это помогло улучшить переводческие инструменты.
Словарь:
Linguist /ˈlɪŋ.ɡwɪst/ — лингвист
Conversation /ˌkɒn.vəˈseɪ.ʃən/ — разговор
Goal /ɡəʊl/ — цель
Real /rɪəl/ — настоящий
Tool /tuːl/ — инструмент
The Growing Medical Corpus
Растущий медицинский корпус
Doctors around the world submitted their reports to a shared medical corpus. It allowed faster responses to rare diseases. Collaboration saved lives.
Врачи со всего мира присылали свои отчёты в общий медицинский корпус. Это позволило быстрее реагировать на редкие болезни. Сотрудничество спасло жизни.
Словарь:
Submit /səbˈmɪt/ — подавать
Report /rɪˈpɔːt/ — отчёт
Disease /dɪˈziːz/ — болезнь
Collaboration /kəˌlæb.əˈreɪ.ʃən/ — сотрудничество
Save /seɪv/ — спасать
Students and the Corpus Project
Студенты и проект корпуса
At university, students were tasked with building a small corpus of local news articles. They learned how to tag grammar, study word use, and create statistics. It was a challenging but rewarding project.
В университете студентам поручили создать небольшой корпус местных новостных статей. Они научились размечать грамматику, изучать употребление слов и составлять статистику. Это был сложный, но полезный проект.
Словарь:
Article /ˈɑː.tɪ.kəl/ — статья
Tag /tæɡ/ — размечать
Use /juːs/ — использование
Statistical /stəˈtɪs.tɪ.kəl/ — статистический
Rewarding /rɪˈwɔː.dɪŋ/ — полезный, приносящий удовлетворение